Edmund GRIMLEY EVANS wrote:
saluton Edmund.Mi pensas, ke mi jam menciis Äi tie programeton, kiun mi uzas por kontroli literumon kaj aldoni dividstrekojn. Specifi tian programon estas pli malfacile ol realigi Äin, sed mi Äus krei malneton de manpaÄo, kiun vi povas legi sube.
Mi bonvenigus komentojn.
La programo mem ne jam tute kongruas kun la manpaÄo, sed mi povos baldaÅ publikigi Äin, se iu interesiÄas. Temas pri ÄirkaÅ 300 linioj da Perl-galimatio.
Edmundo
-----------------------------------------------------------------------
espell [-NIVELO] [-d | -l | -a | -s | -v] VORTARO TEKSTOJ ...
NIVELO estas cifero difinanta la akceptemon de la vortrekonilo:
0 Rekoni nur vortojn, kiuj aperas eksplicite en la vortaro. 1 Rekoni ankaÅ kunmetaÄojn el vortoj en la vortaro. 9 Rekoni Äiujn vortojn per divenado.
La implicita valoro de la NIVELO dependas de la funkcio.
La funkcioj estas:
-d Dividi vortojn en vorterojn (NIVELO=9 implicite).
{...} kun | indikas plurajn dividojn trovitajn. {...} sen | indikas nerekonitan vorton.
Ekzemple: Sinjoro Bimbam estas sentema poeto. -> Sinjor`o {Bimbam} est`as {sent`em`a|sen`tem`a} poet`o.
-l Listigi nerekonitajn vortojn (NIVELO=0 implicite).
-a Diveni aldonojn por la vortaro (NIVELO=9 implicite).
La eligo konsistas el registro por la vortaro por Äiu rekonita vorto, kiu ne jam estas eksplicite en la vortaro. Se vorto estas plurmaniere rekonita, pluraj ebloj aperas en la sama linio. Necesas redakti tiajn liniojn, antaÅ ol aldoni ilin al la vortaro. Kompreneble, se la kontrolata teksto eble havas erarojn aÅ fremdaÄojn, oni volas Äiuokaze kontroli la eligon de -a.
Ekzemple: La sendana Bimbam fomas la knipon. -> send'an'a4 sen'dan'a4 Bimbam0 fom8 knip'o4
-s Aldoni dividstrekojn (NIVELO=0 implicite).
La Äusta maniero dividi Esperantajn vortojn estas temo de eterna diskutado. Äi tiu programo arbitre aplikas la sekvan proceduron.
Unue, dividu la vorton laÅ Äiaj vorteroj, sed ignorante la dividojn antaÅ gramatika finaÄo (o a j n e i as is os us u).
Due, kie mankas divido inter du vokaloj, dividu la konsonantojn laÅeble egale, kun pli granda parto post la divido Äe nepara nombro de konsonantoj; tamen, farante tion oni ignoru la literon Å post vokalo kaj la literon J post vokalo kaj antaÅ konsonanto.
Se vorto estas plurmaniere rekonita, unue Äi estas dividita laÅ Äiu analizo, kaj poste la dividoj estas kunigitaj, tiel ke dividstreko eblas nur tie, kie estas divido laÅ Äiu analizo.
Ekzemple: nigraharulineto -> nig\-ra\-har\-ul\-in\-e\-to teo teko tekso teksto ekstra -> te\-o te\-ko tek\-so tek\-sto eks\-tra majo naÅa kanto pajnto aÅskulti -> ma\-jo naÅ\-a kan\-to pajn\-to aÅs\-kul\-ti sentema -> sente\-ma
-v Eligi vortaron de la uzataj vortoj (NIVELO=9 implicite).
La eligo konsistas el Äiuj registroj el la vortaro, kiuj estis uzataj dum traktado de la teksto. Traktado de la teksto per la nova subvortaro donos samajn rezultojn kiel traktado per la originala vortaro.
Se oni uzas la programon kun -s por komposti dokumenton el fonto en CVS, oni eble deziras, ke ankaÅ la vortaro estu en CVS, por ke oni ricevu saman rezulton el sama fonto. Per -v oni povas meti en CVS nur la bezonatan subvortaron.
La VORTARO havas unu vorton en Äiu linio, dividitan en vorterojn per apostrofoj. La lasta signo en Äiu linio montras la vortspecon:
1 Sen gramatikaj finaÄoj. 2 AnkaÅ kun -N (2 ebloj). 4 AnkaÅ kun -J kaj -N (4 ebloj). 8 Kun Äiuj finaÄoj de netransitiva verbo (33 ebloj). 9 Kun Äiuj finaÄoj de transitiva verbo (60 ebloj). - Prefikso. / Sufikso. 0 Neesperanta vorto.
Ekzemple:
mal'pli1 neni'o2 pun'labor'ej'o4 re'lev'iÄ8 sub'ten9 al- ist/ sappho0
Äe nivelo 1 la vortrekonilo akceptas ankaÅ kunmetaÄojn el du vortojn el la vortaro. Jenaj specoj de kunmetaÄo estas akceptataj:
RADIKO + (a|e|i|o) + RADIKO + FINAÄO
PREFIKSO + RADIKO + FINAÄO
RADIKO + SUFIKSO + FINAÄO
RADIKO signifas ion, kio aperas en la vortaro kun finaÄo `[aeo][124] aÅ [89], kaj FINAÄO inkluzivas ankaÅ participojn (sume 70 eblojn).
Ekzemple: est`i`bon`o vid`hom`at`a`j`n al`hom`e`n est`ist`as
Ne necesas meti en la vortaron prefikson aÅ sufikson, kiu estas ankaÅ radiko, Äar la reguloj same facile kunmetos mal`rid`i kaj hom`in`o el mal`o kaj in`o kiel el mal- kaj in/. La vortklasoj 0 kaj 1 estas ekvivalentaj laÅ la nuna regularo: nek sappho0 nek ju1 partoprenas en kunmetado.
MANKOJ
Eble indus havi pli komplikajn regulojn pri derivado kaj kunmetado.
Estu eble konverti la vortaron al datenbanka dosiero por pli rapida konsultado.
Estu ia rekonado de apostrofoj kaj dividstrekoj en la teksto.
espell helpus por gnu/linux en Esperanto. Kie estas kodo? eble ni povas meti Äsur tukseo karieroresumoj deponejo ?
-- Olivier
PS:
Mi jus vidis vi laboras Äe cambridge. mi estas Äe cambrige Ägxis sabato. ni povas provi vidi ni kaj aliaj homoj de 'cambridge esperanto group'?

