Headers van nu.nl
Neem de code van het het volgende voorbeeld over.
import re
string = "De kat in de hoed wist dat de vleermuis daar was."
pattern = "de"
matches = re.findall(pattern, string, flags=re.I) # De vlag re.I maakt de zoekopdracht case-insensitive
print(matches)
# Output: ['De', 'de', 'dat', 'de']
De output zijn alle delen van de tekst die de regex matchen. Probeer maar!
Stel je hebt een web pagina. Dus de string is een webpagina, bijvoorbeeld als volgt:
string="<!DOCTYPE html><html><head><title>Mijn webpagina</title></head><body><h1>Mijn eerste kop</h1><p>Dit is een paragraaf.</p><h1>Mijn tweede kop</h1"
xx