Muito bom! Esclarecido! []s,
Menezes 2008/11/28 Raimundo Santos Moura <[EMAIL PROTECTED]> > Quer dizer que já existe um algoritmo de hifenização padrão no OOo, é isso? > Sim. > > Você sabe me explicar o significado das strings presentes no arquivo .dic, > como por exemplo: > > O DivSilab é um arquivo texto. > Seu desenvolvimento está baseado no algorítmo de Frank M. Liang. > O algorítimo de Liang usa valores entre 0 e 9 – exclui-se o valor 0 > (zero), uma vez que está implícito. Valores ímpares indicam possíveis > pontos divisão silábica, e os valores pares (incluindo 0) indicam pontos > que > não devem ter divisão. Números mais altos indicam uma maior magnitude do > "melhor" para os números ímpares, e pares uma maior amplitude do "pior". > > O ponto (.) indica a extremidade de uma palavra. À esquerda início e à > direita término. > Exemplificando: > > Examinemos a palavra a baixo. > > Silábicas > > Extraindo-se do arquivo somente as regras envolvidas para a formação desta > palavra vamos encontrar: > > s2i > i3l2á > l4á > á1b2 > 3b2i > i1c4 > 3c2a > 2s. > > Compondo teremos > > obs.: mudem a fonte para Courier New para visualizar melhor o exemplo. > > s i l á b i c a s > s2i > l4á > i3l2á > l4á > á1b2 > 3b2i > i1c4 > 3c2a > 2s. > ------------------ > s2i3l4á3b2i3c4a2s <--- Resultado > s i-l á-b i-c a s --> si-lá-bi-cas > > Obs.: ao resultado é agregado o maior peso de cada coluna. > > > > Tabela Liang > -------------------------------------------------- > Descrição Peso Entrada Liang > -------------------------------------------------- > Melhor que abaixo 5 9 > Melhor que abaixo 4 7 > Melhor que abaixo 3 5 > Melhor que abaixo 2 3 > Admissível 1 1 > Evitar 0 0 > Pior que acima -1 2 > Pior que acima -2 4 > Pior que acima -3 6 > Pior que acima -4 8 > -------------------------------------------------- > > No nosso trabalho usei até o nível 6. > Desenvolvi dois pequenos aplicativos. Um para gerar combinações ' ab','ac' > ,'ad'... 'ich', 'ras', etc, etc. > O outro para conferir a existência destas combinações no léxico do VERO, > extraindo somente as válidas e o número de ocorrências de cada uma. > > Usei uma planilha no Calc para ordenar e começar a configurar as regras, > começando pelas de maior incidência. As combinações óbvias como 'ca', 'ba', > 'pr', dr, bl... foram rapidamente configuradas ...'c2a', 'b2a', 'p4r', > 'd4r', 'b4l' ... > Para os mais complexos, extraí do Vero todas as palavras contempladas com a > combinação pesquisada, e fui criando as regras. Exemplo 'ic' > mICAreta --> i3c2a > frICCionar --> i2c3c4 > mICRo --> i2c3r4 > ... > > > > E assim, acabei construindo o Divisor Silábico. > > Mais dúvidas Senhores? > > Abraços > > Raimundo > > > > 2008/11/28 CARLOS EDUARDO DANTAS DE MENEZES <[EMAIL PROTECTED]> > > > Raimundo, > > > > Quer dizer que já existe um algoritmo de hifenização padrão no OOo, é > isso? > > Você sabe me explicar o significado das strings presentes no arquivo > .dic, > > como por exemplo: > > > > .csi1 > > .e1o2m5b4 > > .hsi1 > > .hú1b > > .hú2n3 > > .hú2s3 > > .hú3m > > .p4s2a3 > > .p4s2á3 > > ........ > > .p6a1l4e3o2n5 > > .p6a5l4e3o1 > > .p6a5l4e3o1i2c3 > > ......... > > x2e4n6s. > > y2a > > z1z > > z2e4m. > > z2e4n6s. > > > > Sabe me dizer como esse arquivo foi gerado? > > > > > > []s, > > > > Menezes > > > > 2008/11/28 Raimundo Santos Moura <[EMAIL PROTECTED]> > > > >> Carlos, > >> > >> Se é o que estou entendendo... > >> > >> O Divisor é o mesmo para qualquer versão: > >> > >> Para implantar no BrOffice.org usei o arquivo 'dictionaries.xcu'. > >> Na 3.0 eles são guaradados numa subpasta em: > >> C:\Arquivos de programas\BrOffice.org > >> 3\share\uno_packages\cache\uno_packages\... > >> > >> Abri o arquivo 'dictionaries.xcu' com o editor do BrOffice.org e inclui > a > >> seguintes linhas de código: > >> > >> <node oor:name="HyphDic_pt-BR" oor:op="fuse"> > >> <prop oor:name="Locations" oor:type="oor:string-list"> > >> <value>%origin%/dictionaries/hyph_pt_BR.dic</value> > >> </prop> > >> <prop oor:name="Format" oor:type="xs:string"> > >> <value>DICT_HYPH</value> > >> </prop> > >> <prop oor:name="Locales" oor:type="oor:string-list"> > >> <value>pt-BR pt-PT </value> > >> </prop> > >> </node> > >> > >> É isso? > >> > >> > >> > >> > >> > >> > >> > >> 2008/11/28 CARLOS EDUARDO DANTAS DE MENEZES <[EMAIL PROTECTED]> > >> > >> Caro Raimundo, > >>> > >>> Sabe que este assunto nos interessa muito! > >>> Pode compartilhar conosco a maneira em que foi implementado (3.X) ? > >>> > >>> []s, > >>> > >>> Menezes > >>> > >>> 2008/11/28 Raimundo Santos Moura <[EMAIL PROTECTED]> > >>> > >>> Prezados, > >>>> > >>>> Estamos disponibilizando uma nova ferramenta para Divisão silábica > >>>> (Hyphenation), para que seja avaliada por esta exigente comunidade. > >>>> > >>>> Denominada DivSilab, é a nova proposta do VERO para atender aos > anseios > >>>> dos > >>>> usuários, que há algum tempo esperavam uma solução para este problema > no > >>>> BrOffice.org. > >>>> > >>>> A solução é de construção própria do projeto, não derivada de qualquer > >>>> outro > >>>> trabalho. > >>>> > >>>> Esperamos que apreciem, testem e nos passem a impressão que tiverem. > >>>> > >>>> Abraços > >>>> > >>>> Raimundo S. Moura > >>>> > >>>> Para a versão 3.0 em diante > >>>> > http://www.deso-se.com.br/downloads/broffice.org/Vero_pt_BR_V201AOC.oxt > >>>> Para versões anteriores > >>>> http://www.deso-se.com.br/downloads/broffice.org/Vero-hyph_pt_BR.zip > >>>> > >>> > >>> > >> > > > > >
