Yo utilizo amara para parserar html. Para comparar documentos o
subnodos utilizo las funciones de {{{amara.lib.treecompare}}} que
permiten ignorar aspectos no significativos de los nodos (espacios en
blanco, orden de atributos, espacios de nombres ...)Saludos, -- Luis Miguel El día 7 de enero de 2011 16:02, Eli Bendersky <[email protected]> escribió: > difflib tiene un "bug" en Python 2.6 y 3.1 (mira el > http://bugs.python.org/issue2986) que puede causar los problemas que tienes. > En Python 2.7 y 3.2 hay un parametro nuevo en difflib.SequenceMatcher que > puede eliminar el "bug". > > Eli > > > > > 2011/1/7 Milton Galo Patricio Inostroza Aguilera <[email protected]> >> >> esti...@s: >> >> Me han pedido poder notificar a los usuarios de los cambios que sufren >> algunas paginas web de forma periodica (inserción, eliminacion, >> modificación). Estoy utilizando difflib para hacer esta tarea, pero a >> veces tengo comportamientos errones, es decir, existen veces que >> cuando ciertas columnas se parecen (version antigua v/s nueva) >> simplemente no me marca ningún cambio :-S. >> >> Estoy utilizando de esta manera la librería: >> >> >> diff_texto(codecs.open(antiguo).read().splitlines(),codecs.open(nuevo).read().splitlines()) >> >> donde diff_texto es la función que hace el trabajo real: >> >> s = difflib.SequenceMatcher(None, antiguo, nuevo) >> for e in s.get_opcodes(): >> ...bla... >> >> >> lo extraño es que si utilizo unified_diff o el HtmlDiff si me muestra >> los cambios correctos...alguien se ha topado con este tipo de >> problemas?, saludos! >> >> >> >> -- >> Milton >> _______________________________________________ >> Python-es mailing list >> [email protected] >> http://mail.python.org/mailman/listinfo/python-es >> FAQ: http://python-es-faq.wikidot.com/ > > > _______________________________________________ > Python-es mailing list > [email protected] > http://mail.python.org/mailman/listinfo/python-es > FAQ: http://python-es-faq.wikidot.com/ > > _______________________________________________ Python-es mailing list [email protected] http://mail.python.org/mailman/listinfo/python-es FAQ: http://python-es-faq.wikidot.com/
