Ahoj,
před pár dny jsem si se slovníkem začal hrát, jen jsem sesypal data z
adresáře generated/ a vytvořil rozšíření pro LibreOffice.
Pár poznámek:
- LO používá hunspell, ne ispell (neznám rozdíl),
- použil jsem jen seznam slov (soubor .dic) bez pravidel (.aff), takže
je neoptimalizovaný, buď můžeme použít pravidla nová, nebo vzít z
původního (tím bychom ale přišli o PD licenci),
- kromě ostatních slovních druhů chybí na první pohled vlastní jména,
záporná slovesa či třetí stupně přídavných jmen,
- slovník obsahuje i hovorové tvary
=> pro LO bych navrhoval případně zveřejnit jako experimentální, s
náhradou stávajícího bych nespěchal.
Některé zbývající slovní druhy jsem viděl ve zdrojových souborech
slovníku (src/*.txt), možná by se dalo vzít něco odtamtud?
Připojím své oblíbené: jako ideál bych viděl zkombinování s Wikidaty a
jejich (relativně novou) jazykovou databází - co si o tom myslíte?
Mám ohledně slovníku podnikat něco dál? Každopádně si můžu vzít na
starost zabalení pro LibreOffice a publikování mezi jeho oficiálními
rozšířeními...
Díky,
Standa
Dne 19. 02. 19 v 14:06 Ladislav Nesnera napsal(a):
Hola!
Rád bych, aby se uvolněné co nejrychleji přetavilo do aktualizace spell
chackeru, předpokládám ispell <https://en.wikipedia.org/wiki/Ispell>
(zprávičkář <https://www.abclinuxu.cz/lide/ladislav.hagara> z Abclinuxu
se nemůže dočkat, aby mohl upozornit na článek s oznámením :D).
Uvolňuji k tomu poznámky <https://pad.openalt.org/om_korektor>, protože
po e-mailech by se to asi špatně vysvětlovalo a sumarizovalo.
Prvním krokem by bylo být získání chybějících slovních druhů. Jaké jsou
možnosti a které z nich se jeví jako nejschůdnější? (O reakci prosím
zejména Michala S. a Peťu K.)
Korektoru zdar!
;?
_______________________________________________
diskuze mailing list
[email protected]
http://lists.l10n.cz/mailman/listinfo/diskuze