Yo utilizo amara para parserar html. Para comparar documentos o
subnodos utilizo las funciones de {{{amara.lib.treecompare}}} que
permiten ignorar aspectos no significativos de los nodos (espacios en
blanco, orden de atributos, espacios de nombres ...)


Saludos,

--

Luis Miguel



El día 7 de enero de 2011 16:02, Eli Bendersky <[email protected]> escribió:
> difflib tiene un "bug" en Python 2.6 y 3.1 (mira el
> http://bugs.python.org/issue2986) que puede causar los problemas que tienes.
> En Python 2.7 y 3.2 hay un parametro nuevo en difflib.SequenceMatcher que
> puede eliminar el "bug".
>
> Eli
>
>
>
>
> 2011/1/7 Milton Galo Patricio Inostroza Aguilera <[email protected]>
>>
>> esti...@s:
>>
>> Me han pedido poder notificar a los usuarios de los cambios que sufren
>> algunas paginas web de forma periodica (inserción, eliminacion,
>> modificación).  Estoy utilizando difflib para hacer esta tarea, pero a
>> veces tengo comportamientos errones, es decir, existen veces que
>> cuando ciertas columnas se parecen (version antigua v/s nueva)
>> simplemente no me marca ningún cambio :-S.
>>
>> Estoy utilizando de esta manera la librería:
>>
>>
>> diff_texto(codecs.open(antiguo).read().splitlines(),codecs.open(nuevo).read().splitlines())
>>
>> donde diff_texto es la función que hace el trabajo real:
>>
>> s = difflib.SequenceMatcher(None, antiguo, nuevo)
>>    for e in s.get_opcodes():
>>      ...bla...
>>
>>
>> lo extraño es que si utilizo unified_diff o el HtmlDiff si me muestra
>> los cambios correctos...alguien se ha topado con este tipo de
>> problemas?, saludos!
>>
>>
>>
>> --
>> Milton
>> _______________________________________________
>> Python-es mailing list
>> [email protected]
>> http://mail.python.org/mailman/listinfo/python-es
>> FAQ: http://python-es-faq.wikidot.com/
>
>
> _______________________________________________
> Python-es mailing list
> [email protected]
> http://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>
>
_______________________________________________
Python-es mailing list
[email protected]
http://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/

Responder a