Regulární výrazy
Regulární výrazy (RegEx) v Alici slouží k vyhledávání textových vzorů. Podporují se různé znaky a zkratky, které mají speciální význam.
Základní syntaxe
Vzorek |
Popis |
. |
libovolný znak (kromě nového řádku) |
^ |
začátek řetězce |
$ |
konec řetězce |
* |
žádný nebo více výskytů předchozího znaku |
+ |
jeden nebo více výskytů předchozího znaku |
? |
žádný nebo jeden výskyt předchozího znaku |
| |
logické NEBO (např. abc|xyz ) |
() |
seskupení výrazů |
[] |
libovolný jeden znak ze zadané množiny |
[^] |
libovolný znak mimo zadanou množinu |
Speciální zkratky
Zkratka |
Popis |
\d |
číslice (0–9) |
\D |
nečíselný znak |
\w |
alfanumerický znak (a-z , A-Z , 0-9 , _ ) |
\W |
nealfanumerický znak |
\s |
bílý znak (mezera, tabulátor, nový řádek) |
\S |
jakýkoli znak kromě bílého |
Kvantifikátory
Vzorek |
Popis |
a* |
0 nebo více výskytů znaku a |
a+ |
1 nebo více výskytů znaku a |
a? |
0 nebo 1 výskyt znaku a |
a{3} |
právě 3 výskyty znaku a |
a{2,5} |
od 2 do 5 výskytů znaku a |
a{2,} |
alespoň 2 výskyty znaku a |
Ukázky použití
RegEx |
Popis |
^\d{3}-\d{2}-\d{4}$ |
kontrola formátu: 123-45-6789 |
^[A-Z][a-z]+$ |
slovo začínající velkým písmenem |
\b(pes|kočka)\b |
nalezne slovo „pes“ nebo „kočka“ |
^[\w.-]+@[\w.-]+\.\w{2,}$ |
základní kontrola e-mailu |
.*\.pdf$ |
řetězec končící na .pdf |
Tipy
- Používej zpětné lomítko
\
pro speciální znaky, např. \.
pro tečku.