Muito bom! Esclarecido!

[]s,

Menezes

2008/11/28 Raimundo Santos Moura <[EMAIL PROTECTED]>

> Quer dizer que já existe um algoritmo de hifenização padrão no OOo, é isso?
>   Sim.
>
> Você sabe me explicar o significado das strings presentes no arquivo .dic,
> como por exemplo:
>
> O DivSilab é um arquivo texto.
> Seu desenvolvimento está baseado no algorítmo de Frank M. Liang.
> O algorítimo de Liang usa valores entre 0 e 9  –  exclui-se o valor 0
> (zero), uma vez que está  implícito. Valores ímpares indicam possíveis
> pontos divisão silábica, e os valores pares (incluindo 0) indicam pontos
> que
> não devem ter divisão. Números mais altos indicam uma maior magnitude do
> "melhor" para os números ímpares, e pares uma maior amplitude do "pior".
>
> O ponto (.) indica a extremidade de uma palavra. À esquerda início e à
> direita término.
> Exemplificando:
>
> Examinemos a palavra a baixo.
>
> Silábicas
>
> Extraindo-se do arquivo somente as regras envolvidas para a formação desta
> palavra vamos encontrar:
>
> s2i
> i3l2á
> l4á
> á1b2
> 3b2i
> i1c4
> 3c2a
> 2s.
>
> Compondo teremos
>
>  obs.: mudem a fonte para Courier New para visualizar melhor o exemplo.
>
> s i l á b i c a s
> s2i
>    l4á
>  i3l2á
>    l4á
>      á1b2
>       3b2i
>          i1c4
>           3c2a
>               2s.
> ------------------
> s2i3l4á3b2i3c4a2s   <--- Resultado
> s i-l á-b i-c a s --> si-lá-bi-cas
>
> Obs.: ao resultado é agregado o maior peso de cada coluna.
>
>
>
> Tabela Liang
> --------------------------------------------------
> Descrição         Peso       Entrada Liang
> --------------------------------------------------
> Melhor que abaixo   5             9
> Melhor que abaixo   4             7
> Melhor que abaixo   3             5
> Melhor que abaixo   2             3
> Admissível          1             1
> Evitar              0             0
> Pior que acima     -1             2
> Pior que acima     -2             4
> Pior que acima     -3             6
> Pior que acima     -4             8
> --------------------------------------------------
>
> No nosso trabalho usei até o nível 6.
> Desenvolvi dois pequenos aplicativos. Um para gerar combinações ' ab','ac'
> ,'ad'... 'ich', 'ras', etc, etc.
> O outro para conferir a existência destas combinações no léxico do VERO,
> extraindo somente as válidas e o número de ocorrências de cada uma.
>
> Usei uma planilha no Calc para ordenar e começar a configurar as regras,
> começando pelas de maior incidência. As combinações óbvias como 'ca', 'ba',
> 'pr', dr, bl... foram rapidamente configuradas ...'c2a', 'b2a', 'p4r',
> 'd4r', 'b4l' ...
> Para os mais complexos, extraí do Vero todas as palavras contempladas com a
> combinação pesquisada, e fui criando as regras. Exemplo 'ic'
> mICAreta --> i3c2a
> frICCionar --> i2c3c4
> mICRo  --> i2c3r4
> ...
>
>
>
> E assim, acabei construindo o Divisor Silábico.
>
> Mais dúvidas Senhores?
>
> Abraços
>
> Raimundo
>
>
>
> 2008/11/28 CARLOS EDUARDO DANTAS DE MENEZES <[EMAIL PROTECTED]>
>
> > Raimundo,
> >
> > Quer dizer que já existe um algoritmo de hifenização padrão no OOo, é
> isso?
> > Você sabe me explicar o significado das strings presentes no arquivo
> .dic,
> > como por exemplo:
> >
> > .csi1
> > .e1o2m5b4
> > .hsi1
> > .hú1b
> > .hú2n3
> > .hú2s3
> > .hú3m
> > .p4s2a3
> > .p4s2á3
> > ........
> > .p6a1l4e3o2n5
> > .p6a5l4e3o1
> > .p6a5l4e3o1i2c3
> > .........
> > x2e4n6s.
> > y2a
> > z1z
> > z2e4m.
> > z2e4n6s.
> >
> > Sabe me dizer como esse arquivo foi gerado?
> >
> >
> > []s,
> >
> > Menezes
> >
> > 2008/11/28 Raimundo Santos Moura <[EMAIL PROTECTED]>
> >
> >> Carlos,
> >>
> >> Se é o que estou entendendo...
> >>
> >> O Divisor é o mesmo para qualquer versão:
> >>
> >> Para implantar no BrOffice.org usei o arquivo 'dictionaries.xcu'.
> >> Na 3.0 eles são guaradados numa subpasta em:
> >> C:\Arquivos de programas\BrOffice.org
> >> 3\share\uno_packages\cache\uno_packages\...
> >>
> >> Abri o arquivo 'dictionaries.xcu' com o editor do BrOffice.org e inclui
> a
> >> seguintes linhas de código:
> >>
> >>        <node oor:name="HyphDic_pt-BR" oor:op="fuse">
> >>             <prop oor:name="Locations" oor:type="oor:string-list">
> >>                 <value>%origin%/dictionaries/hyph_pt_BR.dic</value>
> >>             </prop>
> >>             <prop oor:name="Format" oor:type="xs:string">
> >>                 <value>DICT_HYPH</value>
> >>             </prop>
> >>             <prop oor:name="Locales" oor:type="oor:string-list">
> >>                 <value>pt-BR pt-PT </value>
> >>             </prop>
> >>         </node>
> >>
> >> É isso?
> >>
> >>
> >>
> >>
> >>
> >>
> >>
> >> 2008/11/28 CARLOS EDUARDO DANTAS DE MENEZES <[EMAIL PROTECTED]>
> >>
> >> Caro Raimundo,
> >>>
> >>> Sabe que este assunto nos interessa muito!
> >>> Pode compartilhar conosco  a maneira em que foi implementado (3.X) ?
> >>>
> >>> []s,
> >>>
> >>> Menezes
> >>>
> >>> 2008/11/28 Raimundo Santos Moura <[EMAIL PROTECTED]>
> >>>
> >>> Prezados,
> >>>>
> >>>> Estamos disponibilizando uma nova ferramenta para Divisão silábica
> >>>> (Hyphenation), para que seja avaliada por esta exigente comunidade.
> >>>>
> >>>> Denominada DivSilab, é a nova proposta do VERO para atender aos
> anseios
> >>>> dos
> >>>> usuários, que há algum tempo esperavam uma solução para este problema
> no
> >>>> BrOffice.org.
> >>>>
> >>>> A solução é de construção própria do projeto, não derivada de qualquer
> >>>> outro
> >>>> trabalho.
> >>>>
> >>>> Esperamos que apreciem, testem e nos passem a impressão que tiverem.
> >>>>
> >>>> Abraços
> >>>>
> >>>> Raimundo S. Moura
> >>>>
> >>>> Para a versão 3.0 em diante
> >>>>
> http://www.deso-se.com.br/downloads/broffice.org/Vero_pt_BR_V201AOC.oxt
> >>>> Para versões anteriores
> >>>> http://www.deso-se.com.br/downloads/broffice.org/Vero-hyph_pt_BR.zip
> >>>>
> >>>
> >>>
> >>
> >
> >
>

Responder a