hola,
tengo el siguiente problema y espero me puedan orientar para resolverlo.
quiero comparar ngramas cuya longitud sea mayor a una palabra. es decir,
tengo un documento N con ngramas del tipo:
n n
n v
n v n j
y varios documentos D que los contienen.
mi pregunta es cómo puedo hacer un programa que dada cualquiera de las
secuencias de N, por ejemplo n v n j,
identifique si la misma secuencia está en D.
con secuencias = 1 no tengo problemas porque lo hago mediante
diccionarios, la cuestión es cuando las secuencias superan ese valor.
algún consejo?
gracias de antemano,
antonio
--
Usando el novísimo cliente de correo de Opera: http://www.opera.com/mail/
_______________________________________________
Python-es mailing list
Python-es@python.org
http://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/