PDA

View Full Version : [Java] Html parser


DarkSiDE
26-06-2006, 11:50
devo realizzare un software che automatizzi l'estrazione degli script presenti nelle pagine web. Bene, problema è l'implementazione di una funzione di "pulizia" che, selezionata una o più pagine, estragga gli script mettendoli in uno o più file esterni e "ripulisca" le pagine da tali script, nonchè ricolleghi le pagine "pulite" agli script estratti.
Sostanzialmente mi chiedevo come posso comportarmi per rimuovere gli script
dalle pagine e restituire le stesse modificate (prive degli script).

Sto utilizzando un parser open source, "HTMLParser Version 1.6"
(http://sourceforge.net/projects/htmlparser/), ma ho grosse difficoltà a
realizzare quest'ultima parte del porgramma.