dobry den, mam tady *.txt soubor (1,3 MB), ktery vznikl automatickym rozpoznanim OCR a zustalo v nem hodne nesmyslnych (tj. castecne nerozpoznanych) slov. Nemam ambici aby mi pspad automaticky provedl nahrazeni zkomolenin spravnym cesky tvarem, jen bych potreboval ty zkomoleniny a patvary z toho *.txt vyhazet. Pomoci regularnich vyrazu mne to nenapada jak. Tak mne napadlo jestli by neslo udelat uzivatelsky konvertor ktery by porovnaval slovo po slove z meho souboru s tim Czech.dic a kdyz by ho nenasel, tak by ho vyhodil, pricemz za "slovo" by se povazoval shluk znaku 1 az X, oddelenych mezerou, nealfanumerrickym znakem, tabem atd..
slo by to nejak udelat ? -- <http://forum.pspad.com/read.php?1,67126,67126> PSPad freeware editor http://www.pspad.com
