2011/2/24 Serhiy Storchaka <[email protected]>:
>
> Список слов сгенерил из исходников словаря для ispell (там внутри есть
> инструкция).

Премного благодарен!  Это именно то, что я искал, только не догадался
взять apt-get source для irussian :)

Для справки, получилась вот такая команда для получения wordlist-а:

$ cat {abbrev,base,computer,for_name,geography,science}.koi | tr
'\243\263' '\305\345' | LANG=C ./sortkoi8 | uniq | sed -e 's:/.*$::g'
| iconv -f koi8-r -t utf-8 >wordlist.utf8

(tr -- заменяет "ё" на "е"; LANG=C исправляет сортировку, например при
en_US.UTF-8 она ведет себя совсем не так, как нужно в данном случае;
sed обрезает концы строк вида "/<affix>")

Всем спасибо за содействие! :)

--
Alex

Ответить