hola,
tengo el siguiente problema y espero me puedan orientar para resolverlo.
quiero comparar ngramas cuya longitud sea mayor a una palabra. es decir, tengo un documento N con ngramas del tipo:
n n
n v
n v n j

y varios documentos D que los contienen.
mi pregunta es cómo puedo hacer un programa que dada cualquiera de las secuencias de N, por ejemplo n v n j,
identifique si la misma secuencia está en D.
con secuencias = 1 no tengo problemas porque lo hago mediante diccionarios, la cuestión es cuando las secuencias superan ese valor.
algún consejo?
gracias de antemano,
antonio


--
Usando el novísimo cliente de correo de Opera: http://www.opera.com/mail/
_______________________________________________
Python-es mailing list
Python-es@python.org
http://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/

Responder a