Wyrażenia regularne

Wyrażenie regularne stanowi wzorzec, do którego możemy dopasowywać teksty. Za jego pomocą można również z regularnego tekstu wyodrębniać pewne jego fragmenty. Elementami wzorca mogą być zwyczajne teksty oraz znaki specjalne, których zestaw i znaczenie prezentujemy w poniższej tabelce:

 

Znak specjalny

Jego znaczenie

/

Znak ten powoduje zignorowanie następnego znaku (następny znak nie jest interpretowany jako znak specjalny)

?

Znak ten zastępuje dowolny inny znak (np: zarówno 'but' jak 'bot' pasują do wzorca 'b?t')

*

Znak ten zastępuje dowolny ciąg znaków

^

Znak ten odpowiada początkowi linii

$

Znak ten odpowiada końcowi linii

[...]

Specyfikuje zestaw znaków (np. [a-zA-Z] specyfikuje małą lub dużą literę alfabetu

[~...]

Specyfikuje zanegowany zestaw znaków (wszystkie znaki z wyjątkiem...)

X1|X2|..|Xn

Alternatywa wzorców.

X1&X2..&Xn

Koniunkcja wzorców

#

 

{..}

Wynznacza sekcję wzorca

Oprócz tego, dostępne są pewne predefiniowane wzorce:

 

Wzorzec

Znaczenie

:a

Specyfikuje znak alfanumeryczny (literę lub cyfrę)

:b

Specyfikuje tzw. "biały" znak (spacja lub tabulacja)

:c

Specyfikuje literę (dużą lub mała)

:d

Specyfikuje cyfrę

:h

Liczba heksadecymalna

:n

Liczba

:w

Słowo złożone z samych liter

:z

Liczba