Baza cea mai mare de cuvinte o are dexonline şi de la ea voi începe, apoi oricine are o listă de cuvinte, o putem intersecta cu cea de la dexonline şi cuvintele comune vor avea un punctaj (încredere) mai mare. Şi baza de date de la dexonline conţine greşeli astfel încât lista trebuie validată, măcar prin sondaj. Listele de cuvinte ar fi întreţinute pe domenii (dicţionar explicativ, tehnic, regional, etc) şi fiecare ar putea să construiască rapid un corector openoffice, firefox sau aspell foarte uşor direct de pe web.
Stau mai prost cu timpul în momentul ăsta, dar ideea de interfaţa web pe care vreau să o fac rămâne în picioare. Între timp, adun liste de cuvinte. În data de 15.05.2007, Ionut Paduraru <[EMAIL PROTECTED]> a scris:
Alexandru - nu cred că e bine să plecăm de la zero, cred că ar trebui creată o lista de cuvinte - forme de bază (să zicem - plecând de la dexonline). Apoi acea listă să fie validată manual - este mai uşor să parcurgi vizual o listă de cuvinte şi să hotărăşti dacă sunt corecte sau nu; crearea de la zero a a listei o consider muncă aproape în zadar. Un dicţionar complet, fără a fi încărcat cu cuvinte inutile, va conţine câteva zeci de mii de cuvinte - nu este uşor nici de întreţinut, darmite de creat manual. P:S: Ştiu că aceste lucruri s-au mai spus aici, pe listă, dar m-am văzut nevoit să le repet. On 15/05/07, Alexandru Szasz <[EMAIL PROTECTED]> wrote: > > De fişierul .aff ne ocupăm mai târziu, acum avem nevoie de fişiere .dic > Ele sunt fişiere text, câte un cuvânt pe o linie. E preferabil să scrii > forma de bază a cuvântului, doar dacă e unul mai special să-i scrii şi > celelalte forme. > > Ex: > > cuvânt > placă > frumos > citi > > Dacă nu este prea greu ar fi util ca după fiecare cuvânt să fie tipul lui, > despărţit de un / > > Ex: > > cuvânt/s.m. > placă/s.f. > frumos/adj. > citi/vb. > > Dacă un cuvânt are mai multe tipuri, de ex. „mare", se scrie de două ori > > mare/adj. > mare/s.f. > > Nu sunt bătute în cuie „adj.", „s.n." dar să fie la fel în tot fişierul. > > În data de 15.05.2007, Radu Dumbraveanu <[EMAIL PROTECTED]> a scris: > > > > Simpatizez ideea realizarii unei interfeţe pe web (eu de exemplu nu nu > > cunosc regulile de introducere a cuvintelor in fisierele .dic si .aff, > > apropo imi puteti recomanda vreo adresa cu ceva tutoriale). si cunostine > > de > > php am, insa cu timpul mai greu. > > > > > > În data de 14.05.2007, Nicu Buculei <[EMAIL PROTECTED]> a scris: > > > > > > Intrucit Radu nu e inca subscris la lista si nu vede raspunsul de la > > > Alexandru, dau un reply pentru a-l adauga in CC > > > > > > Alexandru Szasz wrote: > > > > În data de 14.05.2007, Radu Dumbraveanu <[EMAIL PROTECTED]> a > scris: > > > >> sint prof universitar de matematica si > > > >> as dori sa particip la dezvoltarea corectorul ortografic pentru > limba > > > >> romana; > > > >> in special ma intereseaza dezvoltarea vocabularului tehnic. > > > >> > > > >> Imi putti indica o adresa la care sa fie documentatia respectiva, > > > >> regulile > > > >> si posibilitatea de a te inregistra ca devoloper la proiectul > amintit > > > >> de mine mai sus? > > > >> > > > > > > > > Cea mai importantă este lista de cuvinte. Momentan sunt disponibile > > cea > > > de > > > > la dexonline şi două făcute de alte persoane. Lista este un fişier > > text > > > cu > > > > câte un cuvânt pe o linie. Dacă aveţi o listă deja făcută, şi este > în > > > > formatul acesta, puteţi contribui cu ea. Dacă aveţi cunoştinţe de > > > > programare > > > > php şi puţin timp liber, putem să colaborăm la realizarea unei > > interfeţe > > > pe > > > > web unde să poată contribui mai mulţi oameni cu cuvinte. > > > > > > > > > > -- > > > nicu :: http://nicubunu.ro :: http://nicubunu.blogspot.com > > > my OpenOffice.org pages: http://ooo.nicubunu.ro > > > Open Clip Art Library: http://www.openclipart.org > > > my cool Fedora wallpapers: http://fedora.nicubunu.ro/wallpapers/ > > > > > > > > > -- > Alexandru Szasz >
-- Alexandru Szasz
