On 12/20/10, Alin Iorga <[email protected]> wrote: > Salut, > > Incerc sa inlocuiesc diacritice cu non-diacritice. > > Am incercat si cu sed si cu perl cu ceva de genul instructiunii de mai > jos fara success. > > perl -pi -e "s/x{0103}/a/g" > > Aveti alte sugestii cum as putea face asta? ł perl -CIO -MUnicode::Normalize=NFKD -pe '$_=NFKD($_);s/[\pM\x{feff}]//g'
soluţia nu-i perfectă (lasă în text ex. ł, ø, nu ştie să-l descompună pe æ în ae, etc) > > Sau ca alternativa, poate exista cumva pe linux un tool sau un script > relativ simplu sa transforme un text cu diacritice UTF8 in unul fara, > codificat ANSI - ma intereseaza caracterele cu caciulite, codite sau > alte insemne sa fie transformate in caracterele simple (si eventual sa > elimine caracterul de BOM de la inceput de fisier daca este prezent). > > Daca nu, nu sint asa multe caractere care vreau sa le transform si daca > e o expresie care sa functioneze pentru un caracter, pot sa fac expresii > pentru toate caracterele de care sint interesat. > > Multumesc, > Alin. > _______________________________________________ > RLUG mailing list > [email protected] > http://lists.lug.ro/mailman/listinfo/rlug > _______________________________________________ RLUG mailing list [email protected] http://lists.lug.ro/mailman/listinfo/rlug
