On 12/20/10, Alin Iorga <[email protected]> wrote:
> Salut,
>
> Incerc sa inlocuiesc diacritice cu non-diacritice.
>
> Am incercat si cu sed si cu perl cu ceva de genul instructiunii de mai
> jos fara success.
>
> perl -pi -e "s/x{0103}/a/g"
>
> Aveti alte sugestii cum as putea face asta?
ł
perl -CIO -MUnicode::Normalize=NFKD -pe '$_=NFKD($_);s/[\pM\x{feff}]//g'

soluţia nu-i perfectă (lasă în text ex. ł, ø, nu ştie să-l descompună
pe  æ în ae, etc)

>
> Sau ca alternativa, poate exista cumva pe linux un tool sau un script
> relativ simplu sa transforme un text cu diacritice UTF8 in unul fara,
> codificat ANSI - ma intereseaza caracterele cu caciulite, codite sau
> alte insemne sa fie transformate in caracterele simple (si eventual sa
> elimine caracterul de BOM de la inceput de fisier daca este prezent).
>
> Daca nu, nu sint asa multe caractere care vreau sa le transform si daca
> e o expresie care sa functioneze pentru un caracter, pot sa fac expresii
> pentru toate caracterele de care sint interesat.
>
> Multumesc,
> Alin.
> _______________________________________________
> RLUG mailing list
> [email protected]
> http://lists.lug.ro/mailman/listinfo/rlug
>
_______________________________________________
RLUG mailing list
[email protected]
http://lists.lug.ro/mailman/listinfo/rlug

Raspunde prin e-mail lui