|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Mar 2006
Messaggi: 2216
|
[BASH] numero parole su pagina html
ciao ragazzi sto cercando di fare uno script che prenda un indirizzo (pagina web) e mi scriva in un file tutte le occorrenze delle parole scritte in essa, quello che dovrei fare sarebbe:
-scaricare la pagina html con wget -filtrarla in un .txt così che siano presenti solo le parole visualizzate sulla pagina web (escludendo quindi la sintassi di html) -analizzare il file e creare un .txt contenente il numero delle occorrenze di tutte le parole distinte nel file il problema è che non riesco a filtrare l'html e lasciare solo quelle parole visibile nella pagina, ho provato con sed -e 's/<[^>]*>//g' ${input_file} > ${output_file} ma niente, qualche consiglio?
__________________
Mobo: Asus Sabertooth990fx Rev2.0 | Cpu: FX 8350 @4.8ghz 1.49v / H100i | Ram: 2x8gb DDR3 2400 Corsair Vengeance Pro | Vga: XFX GTR 480 8gb | Alimentatore: XFX ProSeries XXB Bronze 850w | Case: Homemade (click) | HDD: Seagate barracuda 7200.14 1Tb | SSD: Crucial mx300 750Gb | Monitor: Iiyama xb2374hds-1 ; AOC g2460pf | Input: G300/G11/G13 | Profilo battle.net: Roni#2789 |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 12:19.