El Miércoles, 25 de Octubre de 2006 10:58, Santiago Bosio escribió:

> Fabián, Francisco, José Luis y William:
>
> el desarrollo se migró hace tiempo a un servidor de Subversion, con lo cual
> se facilita mucho el trabajo colaborativo. El repositorio podrán
> visitarlo en:
>
> https://svn.hispalinux.es/websvn/listing.php?repname=rla-es&path=%2F&rev=0&;
>sc=0
>
> A todos los interesados les pediría que visitaran el repositorio y
> observen cómo está estructurado. No existe documentación sobre el
> trabajo :-(, pero estoy disponible para cualquier consulta que quieran
> realizar. La estructura puede parecer un tanto confusa, pero es que el
> formato de los diccionarios, y el funcionamiento de los algoritmos no es
> tan sencillo como puede parecer a priori (no es una mera comparación de
> palabras).

Bien, visité el sitio y me dí cuenta rápidamente que con sólo mirarlo podría 
entender como funciona... en unos dos millones de años :)
Sobre Subversion lo único que sé es que sirve para el control de versiones, 
pero no sé cómo funciona.

Cuando se me pasó el mareo :-) descomprimí el zip es_ANY para mirar la 
estructura del archivo. Resumo lo que entendí:

OOo usa MySpell (otros programas también lo usan), que es una derivación del 
diccionario Aspell.

es_ANY.aff es el archivo de afijos que se usa para relacionar las palabras del 
dicctionario (es_ANY.dic en este caso). Así se evita incluir muchas 
variaciones de una palabra determinadas por la aplicación de prefijos, 
sufijos, etc.

Ejemplos de la estructura de es_ANY.aff

SET ISO8859-1
TRY aeroinsctldumpbgfvhz
REP 20
REP ge hue
REP gi hui
MAP 5
PFX a Y 2
PFX a 0 a [^aeiou]
SFX A Y 18
SFX A ner siciones oner

De esto sólo creo entender que PFX son los prefijos y SFX los sufijos. Lo 
demás no sé qué es.

Ejemplos de la estructura de es_ANY.dic

76440
ababa/N
ababille/S
abollen/h
abollonar/RED
abollone/G
abolorio/S
abolsar/RDE
abombar/RDEP
abombe/SG
abominable/S
abominar/RDEA
acoplar/hRPDE

De aquí creo entender que /algo son caracteres modificadores que se combinan, 
pero ni idea qué es lo que indican.

En el sitio web encontré que hay varias herramientas y documentos:

Aquí se explica el significado de los afijos (particularmente me pareció 
complicado de entender)
https://svn.hispalinux.es/websvn/filedetails.php?repname=rla-es&path=%2Fortograf%2Fafijos%2Fafijos.txt&rev=0&sc=0

Aquí hay herramientas para trabajar con los diccionarios:
https://svn.hispalinux.es/websvn/listing.php?repname=rla-es&path=%2Fortograf%2Fherramientas%2F&rev=0&sc=0

extraer.c (extrae las palabras del diccionario ¿a un archivo nuevo?)
make_dict.sh (construye el diccionario ¿partiendo de qué archivos?)
palabras.sh (ABM de palabras)
remover_comentarios.sh (no comment)

Si estos programas trabajan sobre el servidor Subversion ¿qué programas hay 
que tener instalados? ¿SSH?

Por último hay un enlace "Palabras" que muestra que se dividen según si están 
aceptadas por RAE o no. ¿Se incluyen palabras no RAE en MySpell?

Bueno Santiago, no se si me orienté bien como para empezar, pero quisiera que 
me expliques esto para avanzar un poco.

Saludos.
Fabián Flores.

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Responder a