Headers van nu.nl

Neem de code van ~~het~~ het volgende voorbeeld over.

import re

string = "De kat in de hoed wist dat de vleermuis daar was."
pattern = "de"

matches = re.findall(pattern, string, flags=re.I)  # De vlag re.I maakt de zoekopdracht case-insensitive

print(matches)
# Output: ['De', 'de', 'dat', 'de']

De output zijn alle delen van de tekst die de regex matchen. Probeer maar!

Stel je hebt een web pagina. Dus de string is een webpagina, bijvoorbeeld als volgt:

string="<!DOCTYPE html><html><head><title>Mijn webpagina</title></head><body><h1>Mijn eerste kop</h1><p>Dit is een paragraaf.</p><h1>Mijn tweede kop</h1"