Headers van nu.nl
Neem de code van het volgende voorbeeld over.
import re
string = "De kat in de hoed wist dat de vleermuis daar was."
pattern = "de"
matches = re.findall(pattern, string, flags=re.I) # De vlag re.I maakt de zoekopdracht case-insensitive
print(matches)
De output zijn alle delen van de tekst die de regex matchen. Probeer maar!
Stel je hebt een web pagina. Dus de string is een webpagina, bijvoorbeeld als volgt:
string="<!DOCTYPE html><html><head><title>Mijn webpagina</title></head><body><h1>Mijn eerste kop</h1><p>Dit is een paragraaf.</p><h1>Mijn tweede kop</h1"
xx