Re: sed e accentate...

2012-03-22 Per discussione Giuseppe Sacco
Il giorno gio, 22/03/2012 alle 08.12 +0100, bodr...@mail.dm.unipi.it ha scritto: [...] > Mi resterebbe la curiosità di capire perché per sed, se LANG=C > l'espressione regolare ".*" include senza problemi anche un carattere > accentato in una codifica sbagliata, mentre altrimenti no... Ad esempio,

Re: sed e accentate...

2012-03-22 Per discussione bodrato
Ciao, Il Mer, 21 Marzo 2012 4:18 pm, Piviul ha scritto: > bodr...@mail.dm.unipi.it scrisse in data 21/03/2012 15:50: >> $ man iconv >> ... >> --to-code, -t encoding >> Convert characters to encoding. If not specified the encoding >> corresponding to the current locale is used. > Avevo

Re: sed e accentate...

2012-03-21 Per discussione Piviul
bodr...@mail.dm.unipi.it scrisse in data 21/03/2012 15:50: > Dici? Eppure ho solo seguito il manuale: > $ man iconv > ... > --to-code, -t encoding > Convert characters to encoding. If not specified the encoding > corresponding to the current locale is used. > > Ho valutato che non speci

Re: sed e accentate...

2012-03-21 Per discussione bodrato
Ciao, Il Mer, 21 Marzo 2012 3:33 pm, Piviul ha scritto: > bodr...@mail.dm.unipi.it scrisse in data 21/03/2012 15:29: >> Purtroppo, iconv non è la soluzione: >> $ iconv -f us-ascii > iconv: sequenza di input non consentita alla posizione 2801459 >> > perché non lo hai usato bene: iconv -f us-ascii

Re: sed e accentate...

2012-03-21 Per discussione bodrato
Ciao, Il Mer, 21 Marzo 2012 2:46 pm, Giuseppe Sacco ha scritto: > Il giorno mer, 21/03/2012 alle 12.25 +0100, bodr...@mail.dm.unipi.it ha > [...] >> Ho pensato di risolvere la questione usando sed come segue: >> $ sed -e 's/|totStra|.*$//' primaDtotStra.csv >> $ sed -e 's/^.*|totStra|/totStra|/'

Re: sed e accentate...

2012-03-21 Per discussione Piviul
bodr...@mail.dm.unipi.it scrisse in data 21/03/2012 15:29: > Purtroppo, iconv non è la soluzione: > $ iconv -f us-ascii iconv: sequenza di input non consentita alla posizione 2801459 > perché non lo hai usato bene: iconv -f us-ascii -t ??? dove al posto di ??? devi mettere il tuo char encoding

Re: sed e accentate...

2012-03-21 Per discussione bodrato
Ciao Pivul! Il Mer, 21 Marzo 2012 2:25 pm, Piviul ha scritto: > che io sappia sed non ha alcun problema con le accentate. Probabilmente Anche io lo speravo. > il tuo problema è che la variabile d'ambiente LANG non corrisponde con > la codifica usata nei files. Prova a controllare: file --mime-e

Re: sed e accentate...

2012-03-21 Per discussione Giuseppe Sacco
Ciao Marco, Il giorno mer, 21/03/2012 alle 12.25 +0100, bodr...@mail.dm.unipi.it ha scritto: [...] > Ho pensato di risolvere la questione usando sed come segue: > $ sed -e 's/|totStra|.*$//' primaDtotStra.csv > $ sed -e 's/^.*|totStra|/totStra|/' dopoDtotStra.csv Se non ho capito male, vuoi che l

Re: sed e accentate...

2012-03-21 Per discussione Alessandro T.
Il 21/03/2012 12:25, bodr...@mail.dm.unipi.it ha scritto: Parto da un file stat.csv, che (solo in un paio di possibili campi) contiene delle lettere accentate. Per ragioni che non vi sto a dettagliare ho bisogno di dividere le righe in due: ciò che sta prima di "|totStra|" e ciò che sta dopo. Ho

Re: sed e accentate...

2012-03-21 Per discussione Piviul
bodr...@mail.dm.unipi.it scrisse in data 21/03/2012 12:25: > [...] > Visto che le righe sono tutto sommano poche, sto risolvendo "a mano", ma > se qualcuno mi sapesse suggerire un modo elegante per convincere sed a > "match-are" le accentate nell'espressione ".*", ne sarei contento. > che io sap

sed e accentate...

2012-03-21 Per discussione bodrato
Carissimi, Ho un problemetto con sed. Parto da un file stat.csv, che (solo in un paio di possibili campi) contiene delle lettere accentate. Per ragioni che non vi sto a dettagliare ho bisogno di dividere le righe in due: ciò che sta prima di "|totStra|" e ciò che sta dopo. Ho pensato di risolver