El 1/11/05, Enrique Place<[EMAIL PROTECTED]> escribió: > Tengo "heredado" código html muy "chancho" (muchos generados a partir > de Word) y me están haciendo perder mucho tiempo porque quiero borrar > todas las marcas de estilos, fonts y varios indeseables. > > Quiero tener como resultado un código limpio html, lo más básico posible. > Qué scripts/utilidades pueden recomendar? > > Uso Quanta y Eclipse/PHPEclipse, pero no encontré este tipo de funcionalidad. > Estuve buscando en Freshmeat.net, y encontré muchos interesantes: > > Microsoft Word 2002 Unmunger > http://freshmeat.net/projects/wordunmunger/ > > html_scrub > http://freshmeat.net/projects/htmlscrub/ > > Html To Xhtml Convertor - Default branch > http://freshmeat.net/projects/htx/ > > Sugerencias, experiencias? En lo posible para consola, y siempre, GPL > (aunque toleraría algún BSD ;-) > > -- > Saludos, Enrique. > >
no pillaste el mejor de todos. TIDY http://www.w3.org/People/Raggett/tidy/ -- Cristian Rodriguez. "for DVDs in Linux screw the MPAA and ; do dig $DVDs.z.zoy.org ; done | \ perl -ne 's/\.//g; print pack("H224",$1) if(/^x([^z]*)/)' | gunzip"

