Quer dizer que já existe um algoritmo de hifenização padrão no OOo, é isso?
Sim.
Você sabe me explicar o significado das strings presentes no arquivo .dic,
como por exemplo:
O DivSilab é um arquivo texto.
Seu desenvolvimento está baseado no algorítmo de Frank M. Liang.
O algorítimo de Liang usa valores entre 0 e 9 – exclui-se o valor 0
(zero), uma vez que está implícito. Valores ímpares indicam possíveis
pontos divisão silábica, e os valores pares (incluindo 0) indicam pontos que
não devem ter divisão. Números mais altos indicam uma maior magnitude do
"melhor" para os números ímpares, e pares uma maior amplitude do "pior".
O ponto (.) indica a extremidade de uma palavra. À esquerda início e à
direita término.
Exemplificando:
Examinemos a palavra a baixo.
Silábicas
Extraindo-se do arquivo somente as regras envolvidas para a formação desta
palavra vamos encontrar:
s2i
i3l2á
l4á
á1b2
3b2i
i1c4
3c2a
2s.
Compondo teremos
obs.: mudem a fonte para Courier New para visualizar melhor o exemplo.
s i l á b i c a s
s2i
l4á
i3l2á
l4á
á1b2
3b2i
i1c4
3c2a
2s.
------------------
s2i3l4á3b2i3c4a2s <--- Resultado
s i-l á-b i-c a s --> si-lá-bi-cas
Obs.: ao resultado é agregado o maior peso de cada coluna.
Tabela Liang
--------------------------------------------------
Descrição Peso Entrada Liang
--------------------------------------------------
Melhor que abaixo 5 9
Melhor que abaixo 4 7
Melhor que abaixo 3 5
Melhor que abaixo 2 3
Admissível 1 1
Evitar 0 0
Pior que acima -1 2
Pior que acima -2 4
Pior que acima -3 6
Pior que acima -4 8
--------------------------------------------------
No nosso trabalho usei até o nível 6.
Desenvolvi dois pequenos aplicativos. Um para gerar combinações ' ab','ac'
,'ad'... 'ich', 'ras', etc, etc.
O outro para conferir a existência destas combinações no léxico do VERO,
extraindo somente as válidas e o número de ocorrências de cada uma.
Usei uma planilha no Calc para ordenar e começar a configurar as regras,
começando pelas de maior incidência. As combinações óbvias como 'ca', 'ba',
'pr', dr, bl... foram rapidamente configuradas ...'c2a', 'b2a', 'p4r',
'd4r', 'b4l' ...
Para os mais complexos, extraí do Vero todas as palavras contempladas com a
combinação pesquisada, e fui criando as regras. Exemplo 'ic'
mICAreta --> i3c2a
frICCionar --> i2c3c4
mICRo --> i2c3r4
...
E assim, acabei construindo o Divisor Silábico.
Mais dúvidas Senhores?
Abraços
Raimundo
2008/11/28 CARLOS EDUARDO DANTAS DE MENEZES <[EMAIL PROTECTED]>
> Raimundo,
>
> Quer dizer que já existe um algoritmo de hifenização padrão no OOo, é isso?
> Você sabe me explicar o significado das strings presentes no arquivo .dic,
> como por exemplo:
>
> .csi1
> .e1o2m5b4
> .hsi1
> .hú1b
> .hú2n3
> .hú2s3
> .hú3m
> .p4s2a3
> .p4s2á3
> ........
> .p6a1l4e3o2n5
> .p6a5l4e3o1
> .p6a5l4e3o1i2c3
> .........
> x2e4n6s.
> y2a
> z1z
> z2e4m.
> z2e4n6s.
>
> Sabe me dizer como esse arquivo foi gerado?
>
>
> []s,
>
> Menezes
>
> 2008/11/28 Raimundo Santos Moura <[EMAIL PROTECTED]>
>
>> Carlos,
>>
>> Se é o que estou entendendo...
>>
>> O Divisor é o mesmo para qualquer versão:
>>
>> Para implantar no BrOffice.org usei o arquivo 'dictionaries.xcu'.
>> Na 3.0 eles são guaradados numa subpasta em:
>> C:\Arquivos de programas\BrOffice.org
>> 3\share\uno_packages\cache\uno_packages\...
>>
>> Abri o arquivo 'dictionaries.xcu' com o editor do BrOffice.org e inclui a
>> seguintes linhas de código:
>>
>> <node oor:name="HyphDic_pt-BR" oor:op="fuse">
>> <prop oor:name="Locations" oor:type="oor:string-list">
>> <value>%origin%/dictionaries/hyph_pt_BR.dic</value>
>> </prop>
>> <prop oor:name="Format" oor:type="xs:string">
>> <value>DICT_HYPH</value>
>> </prop>
>> <prop oor:name="Locales" oor:type="oor:string-list">
>> <value>pt-BR pt-PT </value>
>> </prop>
>> </node>
>>
>> É isso?
>>
>>
>>
>>
>>
>>
>>
>> 2008/11/28 CARLOS EDUARDO DANTAS DE MENEZES <[EMAIL PROTECTED]>
>>
>> Caro Raimundo,
>>>
>>> Sabe que este assunto nos interessa muito!
>>> Pode compartilhar conosco a maneira em que foi implementado (3.X) ?
>>>
>>> []s,
>>>
>>> Menezes
>>>
>>> 2008/11/28 Raimundo Santos Moura <[EMAIL PROTECTED]>
>>>
>>> Prezados,
>>>>
>>>> Estamos disponibilizando uma nova ferramenta para Divisão silábica
>>>> (Hyphenation), para que seja avaliada por esta exigente comunidade.
>>>>
>>>> Denominada DivSilab, é a nova proposta do VERO para atender aos anseios
>>>> dos
>>>> usuários, que há algum tempo esperavam uma solução para este problema no
>>>> BrOffice.org.
>>>>
>>>> A solução é de construção própria do projeto, não derivada de qualquer
>>>> outro
>>>> trabalho.
>>>>
>>>> Esperamos que apreciem, testem e nos passem a impressão que tiverem.
>>>>
>>>> Abraços
>>>>
>>>> Raimundo S. Moura
>>>>
>>>> Para a versão 3.0 em diante
>>>> http://www.deso-se.com.br/downloads/broffice.org/Vero_pt_BR_V201AOC.oxt
>>>> Para versões anteriores
>>>> http://www.deso-se.com.br/downloads/broffice.org/Vero-hyph_pt_BR.zip
>>>>
>>>
>>>
>>
>
>