Da, cred că e o problemă la input, dar nu-mi dau seama care. Am făcut testul cu stringul "și" care e reprezentat ok într-un editor de text, dar e reprezentat ca "?i" în terminal (presupun că din cauza fontului?).
adrianp@frost:~/development/dictionaries$ echo "?i" | iconv -f UTF-8 -t ASCII//TRANSLIT ?i adrianp@frost:~/development/dictionaries$ echo "?i" | iconv -f UTF-8 -t ASCII//TRANSLIT | hexdump 0000000 693f 000a 0000003 adrianp@frost:~/development/dictionaries$ echo "?i" | od -h 0000000 693f 000a 0000003 adrianp@frost:~/development/dictionaries$ echo $LANG en_US.UTF-8 După cum se vede, outputul din iconv e identic cu inputul... Problema e că "69" reprezintă "i" în ASCII, iar "3f" reprezintă "?". Ceea ce înseamnă că shellul meu nu suportă UTF-8, nu-i așa? 2016-06-11 22:33 GMT+03:00 Sîrbu Lucian <[email protected]>: > iconv .../TRANSLIT merge ok, cand are inputul definit cum trebuie. Nu > cred ca acopera nici el toate ciudateniile de caractere, mai ales ca utf8 e > f f f extins. Dar caracterele romanesti le-am testat acum 2-3 ani si isi > facea treaba bine. > > On Fri, Jun 10, 2016 at 5:11 PM, Adrian Popa <[email protected]> > wrote: > > > html2text. O sa verific daca pot specifica encoding, mersu! > > On 10 Jun 2016 16:08, "Claudiu Nicolaie CISMARU" < > [email protected]> > > wrote: > > > > > > Poate problema e că inputul nu e UTF8? > > > > adrianp@frost:~/development/dictionaries$ file wiki_ro_full.txt > > > > wiki_ro_full.txt: Non-ISO extended-ASCII text, with LF, NEL line > > > terminators > > > > > > Inputul tau este un amalgam. Cum ai extras textul? > > > > > > > > _______________________________________________ > > RLUG mailing list > > [email protected] > > http://lists.lug.ro/mailman/listinfo/rlug > > > > > > -- > -------------------------------------------- > ----THE END of this transmission---- > _______________________________________________ > RLUG mailing list > [email protected] > http://lists.lug.ro/mailman/listinfo/rlug > _______________________________________________ RLUG mailing list [email protected] http://lists.lug.ro/mailman/listinfo/rlug
