Samenvatting Theorie
Basis
Teken |
Uitleg |
^ |
Dit betekent dat we een match willen maken vanaf het begin van de string. |
[ ] |
De rechte haakjes geven aan dat we een groep gaan maken, een groep is een groep karakters waarmee de tekst moet worden gevalideerd. |
[0-9A-F] |
Dit betekent dat we een 0 t/m.9 of een A t/m F willen matchen. |
+ |
Het plus teken betekent dat we hetgeen dat tussen [] staat 1 of meer keer willen matchen. |
$ |
Betekent dat we tot aan het einde van de string willen matchen. |
Place holders
Teken |
Betekenis |
Voorbeeld |
|
|
als je niets plaats dan moet het element 1x voorkomen. |
A |
Alleen A voldoet |
+ |
een plus betekent 1 of meer keren |
AB+ |
AB en ABBB voldoen |
* |
een * betekent 0, 1 of meer keren |
AB*C |
AC en ABC of ABBBC voldoen |
? |
een ? betekent 0 of 1 keer |
AB?C |
AC en ABC voldoen |
.
|
een . betekent elk (any) karakter
|
.*
|
Elke regel tekst voldoet hieraan.
|
Groeperen
Expressie
|
Uitleg
|
ABC+ |
A komt 1 keer voor dan een B en dan één of meer keren een C. ABCCC is dus goed, AABC niet. |
[A-C]+ |
A,B of C komen 1 of meer keren voor. ABCAABBAA is dus goed en A ook. |
[A-C]{5,6} |
A,B, of C en dat minimaal 5 en maximaal 6 keer. CBBCBA is dus goed, maar CBBCBAC niet omdat dat een karakter te veel is. |
.* |
Elk karakter (any) komt 0 of meer keren voor (alles matched dus). |
Begin en eind
Expressie |
Uitleg |
Voorbeeld van een match |
^ABC |
De tekst begint met ABC, daarna mag alles |
ABC zijn de beginletters van het alfabet. |
^AB*C |
De tekst begint met een A dan 0,1, of meer B's en dan een C, daarna mag alles |
AC wordt gebruikt als afkorting voor airconditioner |
^A*B* |
De tekst mag alleen 0,1 of meer A;s bevatten gevolgd door 0,1 of meer B's. |
BB staat for bed & breakfast |
^[A-Z]+$ |
De tekst bestaat alleen uit hoofdletters en er moet er minimaal één voorkomen. |
KIJK UIT |
Escape karakters (\)
Teken |
Betekenis |
Alternatief
|
\s
|
een spatie of eigenlijk een 'white space' (= spatie of tab)
|
|
\d
|
een plus betekent 1 of meer keren |
[0-9]+ |
\w
|
een woord (a-z, A-Z en underscore)
|
[A-Za-z_]+ |
\\
|
een backslash
|
|
\.
|
een punt
|
|
Haakjes
Met haakjes geef je aan wat je in het resultaat wil.
Expressie
|
Uitleg
|
\d{2}-\d{2}-(\d{4}) |
matched een datum (dd-dd-dddd) en geeft alleen het jaar (dddd) terug.
|
\.\s(.?)
|
matched het einde van de zin (punt gevolgd door spatie) en geeft het eerste karakter van de zin weer. |
--