Estimados

Yo no se mucho sobre procesamiento de textos, intenté algunas cosas con R, 
textmining y algunas cosas por el estilo, mi prioridad es el tratado de 
patologías (por mi profesión). Lo que opté, y hace años que estoy trabajando en 
eso, aunque es muy pero muy duro, es escribir yo mismo un patrón, este tiene 
posibilidades, y luego “comparar” lo escrito a mi patrón. Pero no lo pienso en 
Español, mi razonamiento es en base de datos, donde escribo en varios 
lenguajes, por ejemplo, latín cor, corazón español, por lo que una patología 
cardíaca tendría una de estas palabras, pero si en nuestro idioma tenemos 
tantas palabras y formas para la mismo, el latín tampoco nos salva, el inglés 
podría ser más específico pero también tiene actualización de términos.


Yo pienso que la interpretación del lenguaje depende mucho del algoritmo, pero 
cualquier algoritmo sin una base de datos donde pueda consultar patrones de 
palabras, es trabajo que no da frutos, en cambio una buena cantidad de 
excepciones y definiciones, posiblemente se aproxima a como trabaja nuestro 
celebro, no quiero decir que las redes neuronales son el mejor algoritmo, 
porque hay alternativas, pero sin dudas un aprendizaje estadístico es necesario 
(no se si estadísticamente uso bien el lenguaje, como aprendizaje pensé en por 
ejemplo cadenas de Monte Carlos, Gibbs, esas técnicas donde es mejor colocar 
unos puntos para comenzar). 






Javier Rubén Marcuzzi
Técnico en Industrias Lácteas
Veterinario





De: Carlos J. Gil Bellosta
Enviado el: ‎martes‎, ‎07‎ de ‎julio‎ de ‎2015 ‎11‎:‎22‎ ‎a.m.
Para: MªLuz Morales
CC: [email protected]





Hola, ¿qué tal?

Lo del "grupo de interés temático" de procesamiento del lenguaje
natural en español fue una iniciativa de la Comunidad R Hispano para
tratar de juntar a los interesados en el asunto para que se conociesen
y pudiesen trabajar juntos. Jamás despegó.

La idea era que, igual que existen grupos locales (gente que trabaja
en R en distintos temas y que se juntan periodicamente) podía haber
grupos temáticos (gente que trabaja en un mismo tema pero que no están
físicamente próximos). Hay dos temas interesantes para la comunidad de
usuarios de R en España:

1) Herramientas para el lenguaje. Para el inglés ya hay muchas cosas
hechas. El español es una lengua distinta y gran parte de lo existente
para el inglés no es, en absoluto, trasladable.
2) Mapas.

Insisto: ambas iniciativas están paradas desde hace años.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com




El día 7 de julio de 2015, 12:47, MªLuz Morales <[email protected]> escribió:
> Hola,
> en relación al procesamiento de textos he visto que hay  en r hispano un
> Grupo de interés temático en procesamiento del lenguaje natural con R
> (GITPLN), que está enfocado al procesamiento de textos en español. Es
> bastante interesante, me gustaría saber si se está utilizando actualmente.
>
> Gracias
> Un saludo
>
> El 7 de julio de 2015, 11:14, MªLuz Morales <[email protected]> escribió:
>
>> Buenos días,
>>
>> quisiera saber si existe algún paquete en R para procesamiento de texto,
>> búsqueda de similitudes y ese tipo de cosas. He estado buscando pero no he
>> encontrado nada al respecto.
>>
>> Gracias
>> Un saludo
>>
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> [email protected]
> https://stat.ethz.ch/mailman/listinfo/r-help-es

_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es
        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es

Responder a