|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Jul 2002
Città: Bergamo
Messaggi: 404
|
comando per estrarre testo
Ciao!
stavo cercando un comando linux per estrarre testo da un html, indicandogli solamente l'inizio e la fine del pezzo da estrarre. Esempio: "<codice html da eliminare>pezzo da estrarre<codice html da eliminare>" Ho provato con sed, ma non riesco ad ottenere risultati (e non so neanche se è adatto allo scopo).... |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jul 2002
Città: Bergamo
Messaggi: 404
|
Nessuno che mi riesce a dare una mano?
![]() |
![]() |
![]() |
![]() |
#3 |
Member
Iscritto dal: Jul 2004
Città: Aosta
Messaggi: 130
|
man sed && RTFM && google.
Codice:
magicmushrooms ~ # cat io <html>questo</html> <html>questo</html> <html>dovrebbe</html> <html>andare</html> <html>bene</html> <html>no?</html> magicmushrooms ~ # sed -e 's/<html>//g' -e 's/<\/html>//g' io questo questo dovrebbe andare bene no? magicmushrooms ~ #
__________________
"Not all men who drink are poets. Some of us drink because we aren't poets." bionicoz@bionicoz.biz - PGP Key: bionicoz.asc |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Jan 2001
Città: Milano
Messaggi: 5707
|
in alternativa
sed -e 's/<codice html da eliminare>\(.*\)<codice html da eliminare>/\1/' file_html se però l'html ha anche altri tag devi modificarlo per farglieli eliminare |
![]() |
![]() |
![]() |
#5 | |
Senior Member
Iscritto dal: Jan 2001
Città: Milano
Messaggi: 5707
|
Quote:
ha detto che ha usato sed ma non è riuscito a venirne a capo, un forum serve per chiedere no? ![]() |
|
![]() |
![]() |
![]() |
#6 |
Member
Iscritto dal: Jul 2004
Città: Aosta
Messaggi: 130
|
kingv, hai ragione, ma il fatto è che fino a 5 minuti fa nemmeno io avevo mai usato sed. In ogni caso scusa Michele81, evterò gli rtfm sul forum.. (ma li conserverò per irc... muhahah come sono bofh!!!
![]()
__________________
"Not all men who drink are poets. Some of us drink because we aren't poets." bionicoz@bionicoz.biz - PGP Key: bionicoz.asc |
![]() |
![]() |
![]() |
#7 | |
Senior Member
Iscritto dal: Jul 2002
Città: Bergamo
Messaggi: 404
|
Quote:
"Ho provato con sed, ma non riesco ad ottenere risultati (e non so neanche se è adatto allo scopo)...." lasciava intendere che un po' con sed ci ho smanettato. Dell'esempio che hai riportato tu ne è pieno il web, e tratta una semplice sostituzione, una per ogni colonna...non ti è forse venuto il dubbio che ci abbia già provato? ![]() ![]() Tranquillo per il rtfm ![]() @kingv: stasera provo il tuo Ciao! |
|
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Jan 2001
Città: Milano
Messaggi: 5707
|
Quote:
penso che quello che cerchi sia qualcosa del tipo: Codice:
sed -n -e 's/.*<tag_inizio>\(.*\)<tag_fine>.*/\1/p' nome_file |
|
![]() |
![]() |
![]() |
#9 |
Senior Member
Iscritto dal: Jan 2001
Città: Milano
Messaggi: 5707
|
ripensandoci se i tag <tag_inizio> e <tag_file> sono su righe diverse non funziona nemmeno così
![]() |
![]() |
![]() |
![]() |
#10 | |
Senior Member
Iscritto dal: Jul 2002
Città: Bergamo
Messaggi: 404
|
Quote:
![]() ![]() Grazie mille! ![]() |
|
![]() |
![]() |
![]() |
#11 | |
Senior Member
Iscritto dal: Jan 2001
Città: Milano
Messaggi: 5707
|
Quote:
bene ![]() tieni conto che se hai nel tuo file delle situazioni tipo: <tag_inizio>xxx <tag_fine> (cioè su due righe diverse) non funziona ![]() |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 18:01.