23-07-2011, 10:10 AM
C'est un peu l'horreur ce HTML. D'où provient-il ? Ne peut-il rien avoir de mieux en entrée ? :/
Il existe bien des parser HTML capables de corriger du code moisi.
En Ruby, il y a Nokogiri mais je ne sais pas si il existe un équivalent si puissant en PHP.
Depuis la source que tu as donné, voici le résultat :
Il existe bien des parser HTML capables de corriger du code moisi.
En Ruby, il y a Nokogiri mais je ne sais pas si il existe un équivalent si puissant en PHP.
fucked_html = '...'
document = Nokogiri.parse(fucked_html)
clean_html = document.to_html
Depuis la source que tu as donné, voici le résultat :
Citation :<p align="left">
<p class="center">hfhgfhgf</p>
<br><br><br>
<u>
hgf
<b>hgfh</b>
gfh
<br><br><br><br>
<font style="font-family:Georgia">
hhttrhtrytryr[tytftre<font color="#3366CC">e]</font>
</font>
</u>
</p>