Saludos,

Sin embargo creo que en segmentación y en ciertas aplicaciones especificas hay gente con resultados buenos. El problema es que casi siempre están en lugares oscuros (e.g. sin el adjetivo de música). Por otro lado es la falta de documentación en la Web, la terminología y el hecho de casi siempre tenerlas que compilar, es algo que espanta a muchos usuarios.

Pero poniéndole el dedo en la yaga a esta lista, lo que siempre molesta en aplicaciones de reconocimiento de voz es la parte de 'prosodia'. Es decir, no es tan solo reconocer las palabras sino lo que significan.

En muchas aplicaciones utilizan la FFT, wavelets, redes neuronales, escucha de máquina y etc, para reconocimiento de voz pero en parte esto restringe al usuario sobre todo en ejemplos como: hay ahí & ¡ ay!.

Reconocer alturas en instrumentos musicales, e inclusive ritmos, es algo un poco mas maduro, pero poco se ha aprendido de esta aproximación, a mi forma de ver.

  --* Juan


On 12/28/2011 06:18 AM, Andres Cabrera wrote:
Hola,

Interesante. Lo que no me gusta de estas APIs es que todo el motor de
analisis queda secreto y privado...
Desafortundamente creo que el estado del arte en sintesis y
reconocimiento de voz en software libre esta bastante atrasada con
respecto a opciones propietarias...


Saludos,
Andres
_______________________________________________

Expyezp mailing list
[email protected]
http://lists.slow.tk/listinfo.cgi/expyezp-slow.tk

Archivo de mensajes:
http://lists.slow.tk/pipermail/expyezp-slow.tk/

Responder a