El día 26 de marzo de 2010 11:21, Roman Gelbort
<[email protected]> escribió:
> Ariel Constenla-Haile escribió:
>> Hola Roman,
>>
>> On Friday 26 March 2010, 10:21:18, Roman Gelbort wrote:
>>> Resulta que el diccionario del usuario (ese que vamos haciendo cuando le
>>> decimos a OOo que agregue esa palabra) se encuentra en:
>>>
>>> directorio_del_usuario\openoffice.org\3\user\wordbook\standard.dic o en
>>> GNU/Linux en:
>>> /home/directorio_del_usuario/.openoffice.org/3/user/wordbook/standard.dic
>>>
>>> Y estos diccionarios sería muy bueno que pudieran "mezclarse" cuando
>>> pertenencen a usuarios de un mismo equipo de trabajo. Por lo menos es la
>>> hipótesis de mi planteo.
>>>
>>> La pregunta es ¿cómo puedo hacer que varios standard.dic se transformen
>>> en uno solo con las palabras que recopiló cada uno en el archivo final?
>>>
>>> Se aceptan ideas, no hace falta que lo resuelvan.
>>
>> no veo otra solución que hacer un "merge" de todos los diccionarios en uno
>> solo, y crear una extensión a partir de él
>> cf.
>> http://extensions.openoffice.org/servlets/BrowseList?list=dev&by=thread&from=2330330
>
> Buen tip, en especial la página para convertir los .dic en una lista de
> texto.
>
> ¿hay otra herramienta para hacer el camino inverso? (de txt a .dic)
>
> En mi caso no necesito hacer una extensión, me resulta más fácil copiar
> esos standard.dic a las ubicaciones correspondientes de los usuarios.

Román:

Yo utilizo un pequeño programa en C para extraer el contenido de los
.dic para que, cuando los usuarios me envían sus diccionarios
personalizados, verifico la lista de palabras y añado al diccionario
oficial las faltantes para la siguiente publicación.

La estructura del diccionario (si mal no recuerdo, porque no tengo el
programita a la mano ahora) consta de un encabezado de 11 bytes que
supongo identifica entre otras cosas el lenguaje para el cual se ha
definido el diccionario. Luego sigue la lista de palabras que tiene la
siguiente estructura: un encabezado de dos bytes al inicio que indica
el número de bytes que ocupa la palabra, y luego los caracteres de la
palabra codificados en UTF8.

Si te parece, podría intentar hacer un pequeño programa que mezcle dos
diccionarios .dic en uno solo.

Saludos,

Santiago

---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]

Responder a