Samenvatting Theorie
Basis
Teken | Uitleg |
---|---|
^ | Dit betekent dat we een match willen maken vanaf het begin van de string. |
[ ] | De rechte haakjes geven aan dat we een groep gaan maken, een groep is een groep karakters waarmee de tekst moet worden gevalideerd. |
[0-9A-F] | Dit betekent dat we een 0 t/m.9 of een A t/m F willen matchen. |
+ | Het plus teken betekent dat we hetgeen dat tussen [] staat 1 of meer keer willen matchen. |
$ | Betekent dat we tot aan het einde van de string willen matchen. |
Place holders
Teken | Betekenis | Voorbeeld | |
als je niets plaats dan moet het element 1x voorkomen. | A | Alleen A voldoet | |
+ | een plus betekent 1 of meer keren | AB+ | AB en ABBB voldoen |
* | een * betekent 0, 1 of meer keren | AB*C | AC en ABC of ABBBC voldoen |
? | een ? betekent 0 of 1 keer | AB?C | AC en ABC voldoen |
. |
een . betekent elk (any) karakter |
.* |
Elke regel tekst voldoet hieraan. |
Groeperen
ABC+ | A komt 1 keer voor dan een B en dan één of meer keren een C. ABCCC is dus goed, AABC niet. |
[A-C]+ | A,B of C komen 1 of meer keren voor. ABCAABBAA is dus goed en A ook. |
[A-C]{5,6} | A,B, of C en dat minimaal 5 en maximaal 6 keer. CBBCBA is dus goed, maar CBBCBAC niet omdat dat een karakter te veel is. |
.* | Elk karakter (any) komt 0 of meer keren voor (alles matched dus). |
Begin en eind
Expressie | Uitleg | Voorbeeld van een match |
^ABC | De tekst begint met ABC, daarna mag alles | ABC zijn de beginletters van het alfabet. |
^AB*C | De tekst begint met een A dan 0,1, of meer B's en dan een C, daarna mag alles | AC wordt gebruikt als afkorting voor airconditioner |
^A*B* | De tekst mag alleen 0,1 of meer A;s bevatten gevolgd door 0,1 of meer B's. | BB staat for bed & breakfast |
^[A-Z]+$ | De tekst bestaat alleen uit hoofdletters en er moet er minimaal één voorkomen. | KIJK UIT |
Escape karakters (\)
Teken | Betekenis | Alternatief |
\s |
een spatie of eigenlijk een 'white space' (= spatie of tab) |
|
\d |
een plus betekent 1 of meer keren | [0-9]+ |
\w |
een woord (a-z, A-Z en underscore) |
[A-Za-z_]+ |
\\ |
een backslash |
|
\. |
een punt |