HTML parsing
Met een hele eenvoudige regex kan je controleren of elke html <table> wordt afgesloten met een </table>.
Dit kan met het volgende Python programma.
import re
def validate_tables(html_text)validate_tables_in_file(filename):
with open(filename, 'r') as file:
html_text = file.read()
# Zoek naar alle geopende tabel tags
opening_tags = re.findall('<table>', html_text)
# Zoek naar alle gesloten tabel tags
closing_tags = re.findall('</table>', html_text)
# Controleer of het aantal geopende en gesloten tags hetzelfde is
if len(opening_tags) == len(closing_tags):
return True
else:
return False
html_text = """
<html>
<body>
<table>
<tr>
<td>Row 1, Cell 1</td>
<td>Row 1, Cell 2</td>
</tr>
<tr>
<td>Row 2, Cell 1</td>
<td>Row 2, Cell 2</td>
</tr>
</table>
</body>
</html>
"""
print(validate_tables(html_text)validate_tables_in_file('your_file.html')) # DitVervang zou'your_file.html' Truemet moetende teruggevennaam van je bestand
Maak een HTML test bestand en test de code uit.
Opdracht
xxJe maakt twee aanpassingen aan de code.
Aanpassing 1
Pas de code zodat je kan controleren of je alle <div> elementen hebt gesloten. Maak twee voorbeeld bestanden; één juiste en één onjuiste waarmee je laat zien dat je code werkt. Gebruik tenminste 6 div elementen in deze voorbeelden.
Aanpassing 2
Zorg ervoor dat de code de naam van het bestand afdrukt en daarachter of dit bestand goed is.
Inleveren
- De aangepaste code.
- Jouw eigen voorbeeld bestanden.
- Een screendump waarin je laat zien dat je de code hebt uitgevoerd met de resultaten.