El Miércoles, 25 de Octubre de 2006 10:58, Santiago Bosio escribió: > Fabián, Francisco, José Luis y William: > > el desarrollo se migró hace tiempo a un servidor de Subversion, con lo cual > se facilita mucho el trabajo colaborativo. El repositorio podrán > visitarlo en: > > https://svn.hispalinux.es/websvn/listing.php?repname=rla-es&path=%2F&rev=0& >sc=0 > > A todos los interesados les pediría que visitaran el repositorio y > observen cómo está estructurado. No existe documentación sobre el > trabajo :-(, pero estoy disponible para cualquier consulta que quieran > realizar. La estructura puede parecer un tanto confusa, pero es que el > formato de los diccionarios, y el funcionamiento de los algoritmos no es > tan sencillo como puede parecer a priori (no es una mera comparación de > palabras).
Bien, visité el sitio y me dí cuenta rápidamente que con sólo mirarlo podría entender como funciona... en unos dos millones de años :) Sobre Subversion lo único que sé es que sirve para el control de versiones, pero no sé cómo funciona. Cuando se me pasó el mareo :-) descomprimí el zip es_ANY para mirar la estructura del archivo. Resumo lo que entendí: OOo usa MySpell (otros programas también lo usan), que es una derivación del diccionario Aspell. es_ANY.aff es el archivo de afijos que se usa para relacionar las palabras del dicctionario (es_ANY.dic en este caso). Así se evita incluir muchas variaciones de una palabra determinadas por la aplicación de prefijos, sufijos, etc. Ejemplos de la estructura de es_ANY.aff SET ISO8859-1 TRY aeroinsctldumpbgfvhz REP 20 REP ge hue REP gi hui MAP 5 PFX a Y 2 PFX a 0 a [^aeiou] SFX A Y 18 SFX A ner siciones oner De esto sólo creo entender que PFX son los prefijos y SFX los sufijos. Lo demás no sé qué es. Ejemplos de la estructura de es_ANY.dic 76440 ababa/N ababille/S abollen/h abollonar/RED abollone/G abolorio/S abolsar/RDE abombar/RDEP abombe/SG abominable/S abominar/RDEA acoplar/hRPDE De aquí creo entender que /algo son caracteres modificadores que se combinan, pero ni idea qué es lo que indican. En el sitio web encontré que hay varias herramientas y documentos: Aquí se explica el significado de los afijos (particularmente me pareció complicado de entender) https://svn.hispalinux.es/websvn/filedetails.php?repname=rla-es&path=%2Fortograf%2Fafijos%2Fafijos.txt&rev=0&sc=0 Aquí hay herramientas para trabajar con los diccionarios: https://svn.hispalinux.es/websvn/listing.php?repname=rla-es&path=%2Fortograf%2Fherramientas%2F&rev=0&sc=0 extraer.c (extrae las palabras del diccionario ¿a un archivo nuevo?) make_dict.sh (construye el diccionario ¿partiendo de qué archivos?) palabras.sh (ABM de palabras) remover_comentarios.sh (no comment) Si estos programas trabajan sobre el servidor Subversion ¿qué programas hay que tener instalados? ¿SSH? Por último hay un enlace "Palabras" que muestra que se dividen según si están aceptadas por RAE o no. ¿Se incluyen palabras no RAE en MySpell? Bueno Santiago, no se si me orienté bien como para empezar, pero quisiera que me expliques esto para avanzar un poco. Saludos. Fabián Flores. --------------------------------------------------------------------- To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]
