Wyrażenie regularne stanowi wzorzec, do którego możemy dopasowywać teksty. Za jego pomocą można również z regularnego tekstu wyodrębniać pewne jego fragmenty. Elementami wzorca mogą być zwyczajne teksty oraz znaki specjalne, których zestaw i znaczenie prezentujemy w poniższej tabelce:
Znak specjalny |
Jego znaczenie |
/ |
Znak ten powoduje zignorowanie następnego znaku (następny znak nie jest interpretowany jako znak specjalny) |
? |
Znak ten zastępuje dowolny inny znak (np: zarówno 'but' jak 'bot' pasują do wzorca 'b?t') |
* |
Znak ten zastępuje dowolny ciąg znaków |
^ |
Znak ten odpowiada początkowi linii |
$ |
Znak ten odpowiada końcowi linii |
[...] |
Specyfikuje zestaw znaków (np. [a-zA-Z] specyfikuje małą lub dużą literę alfabetu |
[~...] |
Specyfikuje zanegowany zestaw znaków (wszystkie znaki z wyjątkiem...) |
X1|X2|..|Xn |
Alternatywa wzorców. |
X1&X2..&Xn |
Koniunkcja wzorców |
# |
|
{..} |
Wynznacza sekcję wzorca |
Oprócz tego, dostępne są pewne predefiniowane wzorce:
Wzorzec |
Znaczenie |
:a |
Specyfikuje znak alfanumeryczny (literę lub cyfrę) |
:b |
Specyfikuje tzw. "biały" znak (spacja lub tabulacja) |
:c |
Specyfikuje literę (dużą lub mała) |
:d |
Specyfikuje cyfrę |
:h |
Liczba heksadecymalna |
:n |
Liczba |
:w |
Słowo złożone z samych liter |
:z |
Liczba |