> PD2: tenho que investigar agora como funciona a integración co
> hunspell/aspell e facer as correccións ortográficas pertinentes.

Hai xa algúns ficheiros de dicionario persoal temáticos aló por lang/gl/spell.
Son dicionarios aspell. Laméntoo, é o  que hai. Co hunspell hai unha
dificultade: hai moitos idiomas para os que aspell abonda. O inglés e
o servio entre eles. Mágoa.

Non é sinxelo construir algo útil no sentido de que saque poucos
erros. Cos ficheiros de xfce que incialmente cantaba uns   490 erros
só baixei a cifra a 420 ou así; claro, os dicionarios que hai son de
media hora de traballo (posieve.py check-spell-ec -slang:gl -saccel:_
| cut -d" " ---f4 | sed -e "s/'//" | tr .... | sort | uniq -c |sort -n
se mal non recordo para sacar a lista de palabras)

No caso de kde, como se usa o campo msgctxt intensamente, é posíbel
estabelecer que non se aplique esta peneira en determinados contextos,
pero polo que vin nos ficheiros de outros proxectos isto non é
universalizábel.

Tamén convén mirar de aplicar esta peneira desde dentro do
check-rules, dado que deste xeito poden terse prefiltrados os textos
das mensaxes, quitando elementos que se sabe van fallar, como
etiquetas e entidades xml, opcións  da liña de ordes etc. Agora ben,
facer isto así cando xa só no ficheiro kdelibs4 hai 565 posíbeis erros
ortográficos paréceme unha temeridade.

> PD3: xa para nota sería tentar facer que posieve funcione con
> languagetool

Non che vai?
Vota a andar o LT mediante  o java -jar LanguageToolGUI.jar (iirc),
escolle neste o galego, minimiza á bandexa -por comodidade- e fai un
posieve.py check-grammar -slang:gl  -sport:8081. Non mudes o porto no
LT. Talvez haxa que usar -slang:gl-es ou -slang:gl_es, non recordo
exactamente, pero rular rulaba.

Hai un^H^H dous problemas:
a) LanguageTool segmenta a día de hai un par de meses fatal, e varias
regras dependen dunha boa segmentación
b) Hai moi poucas regras para ser realmente útil
c) Cona! Arremecagoná! xusto un bon obxectivo para meter traballo nel.
d) Paso de turrar coa regras. Son
mooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooi
complicadas para alguén que non teña uns coñecimentos sólidos de
filoloxía/lingüística.
_______________________________________________
Proxecto mailing list
Proxecto@trasno.net
http://listas.trasno.net/listinfo/proxecto

Responderlle a