Un parseur de HTML en PHP
Publi� le 12 janvier 2006

Si vous avez déjà eu l'idée d'exploiter le contenu d'un fichier HTML dans vos programmes, vous vous êtes sans doute confrontés à une véritable problématique qui vous ont obligé à envisager les expressions régulières. Les fichiers XML sont plus simples mais c'est aussi plus compliqué pour l'ordinateur à exploiter car il existe des logiciels de « parsing » comme SimpleXML SAX ou le DOM. Le problème est qu'un fichier HTML peut ne pas être « correctement » constitué sinon on aurait pu utiliser les fonctions de « parsing » du XML.

Heureusement, il existe plusieurs projets chez Sourceforge dont le rôle est de « parser » le HTML :

-  php-html
-  html-parser