PDA

View Full Version : espressioni regolari (perl o sed)


gurutech
22-07-2003, 13:37
Ciao a tutti,
ho bisogno di effettuare una trasformazione su un file CSV.
Tale file è un estratto di active directory tramite il tool CSVDE.EXE.
Ecco una linea di esempio del file

"CN=PIPPO,OU=Users,DC=dominio,DC=it",PIPPO,pippo@dominio.it,NOME,LOGIN,COGNOME


Ora il separatore di campo è la virgola ( , ) e il tool CSVDE non permette di specificarne un altro. Come potete notare nel primo campo (quello tra le virgolette " " ) la virgola fa parte del valore. Per cui volevo semplicemente fare in modo di cambiare il separatore con un punto e virgola ( ; ).

Sono impazzito con sed, non so un granchè di perl, alla fine mi sono scritto quattro righe di C il cui ciclo principale fa il seguente lavoro

virgolette=0;
while ( ( carattere = fgetc(leggifile) ) != EOF ) {
if ( virgolette==0 && carattere == '"' ) virgolette=1;
/* ^ carattere == apicesingolo virgolettedoppie apicesingolo ^ */
else if ( virgolette==1 && carattere == '"' ) virgolette=0;
if ( !virgolette && carattere == ',' ) carattere = ';';
printf("%c",carattere);
}


che funziona.

La domanda è: siccome questa trasformazione deve essere fatta all'interno di uno script di bash, non è che qualcuno mi può indicare come farla con sed o con perl, in modo da non dover compilare un programma apposito per un lavoro così stupido ?

lovaz
22-07-2003, 14:44
Se vuoi so come farlo con cut:
cut -d \; -f 1
seleziona il primo campo
perl e sed niente, sorry

gurutech
22-07-2003, 14:55
cut è il mio "secondo passo" nello script che sto costruendo.
vedi la riga originale (il primo quote)? non posso usare
cut -d \;
perchè il punto e virgola NON è un separatore
e neanche
cut -d \,
perchè virgola è un separatore ma SOLO all'esterno delle virgolette.
bel problema no?

ilsensine
22-07-2003, 14:58
Fai uno script...
...in c! :D
http://fabrice.bellard.free.fr/tcc/

pippo985
22-07-2003, 14:58
Per il Perl:

-Apri il file CSV
-per ogni riga letta di CSV > $riga_letta=~s/\,/; /g;
-Scrivi $riga_letta su file di appoggio


Con Vi:
-vai sul carattere da modificare (,)
-premi il tasto "c" ed il tasto "l"
-premi il tasto ";"
-salvi

Ciao.

lovaz
22-07-2003, 15:00
Non puoi usare come separatore le "?
A te interessa il primo campo, giusto?

gurutech
22-07-2003, 15:18
x ilsensine:
vabbe tcc o compilare con gcc non mi fa molta differenza

x pippo985
quello che dici tu sostituisce TUTTE le virgole con punto e virgola, e NON DA' il risultato corretto. infatti quando una cosa è compresa tra virgolette la virgola non fa da separatore. Guarda il mio codice C: intercetto l'apertura e la chiusura delle virgolette, e in quel caso non faccio sostituzioni, altrimenti le faccio.

x lovaz

in teoria potrei scartare il primo campo con un
cut -d \" -f 3,
visto che per il lavoro che sto facendo lo devo comunque ricostruire.
Il punto è che vorrei la cosa il più riproducibile possibile. Mi spiego: oggi non me lo ha fatto, ma se domani CSVDE mi inserisce delle virgolette in uno dei campi in mezzo ?

gurutech
23-07-2003, 10:20
up!

kingv
23-07-2003, 13:45
Originariamente inviato da gurutech
up!


mi si sono scervellato mezz'ora ma non ne son venuto fuori nonostante non sia proprio un caprone col sed....
vedo stasera se riesco a farlo andare te lo posto.

gurutech
23-07-2003, 13:51
Originariamente inviato da kingv
vedo stasera se riesco a farlo andare te lo posto.

grazie per l'interessamento. non so come ma bisogna dirgli

quello tra virgolette non lo toccare, nel resto sostituisci le , con ;

come dal codice C che sto attualmente usando.

Con tutte le bibbie che sono state scritte su sed & awk si potrà fare, no?