dobry den, mam tady *.txt soubor (1,3 MB), ktery vznikl automatickym rozpoznanim
OCR a zustalo v nem hodne nesmyslnych (tj. castecne nerozpoznanych) slov. Nemam
ambici aby mi pspad automaticky provedl nahrazeni zkomolenin spravnym cesky
tvarem, jen bych potreboval ty zkomoleniny a patvary z toho *.txt vyhazet.
Pomoci regularnich vyrazu mne to nenapada jak. Tak mne napadlo jestli by neslo
udelat uzivatelsky konvertor ktery by porovnaval slovo po slove z meho souboru s
tim Czech.dic a kdyz by ho nenasel, tak by ho vyhodil, pricemz za "slovo" by se
povazoval shluk znaku 1 az X, oddelenych mezerou, nealfanumerrickym znakem,
tabem atd..

slo by to nejak udelat ?

-- 
<http://forum.pspad.com/read.php?1,67126,67126>
PSPad freeware editor http://www.pspad.com

Odpovedet emailem