[Regular expression] selezionare tag html - Hardware Upgrade Forum

		Hardware Upgrade Forum > Software > Programmazione
[Regular expression] selezionare tag html

Segna i forum come letti

	Recensione HONOR Magic V6: spessore record e super batteria. È lui il fold da battere? HONOR Magic V6 è arrivato in Italia a 2.299,90 euro con una promessa precisa: unire 4 mm di spessore da aperto (8,75 mm chiuso nel modello White, 9 mm negli altri colori) a una batteria da 6.660 mAh, la più capiente mai vista su un pieghevole. Lo abbiamo usato per oltre una settimana in versione Red 16/512 GB per capire se lo Snapdragon 8 Elite Gen 5 tiene testa alla concorrenza anche fuori dai benchmark ufficiali
	Redmi Pad 2 9.7: ampio display, economico e peso contenuto, ma qualche limite nelle prestazioni Redmi Pad 2 9.7 punta su un display ampio e fluido, una batteria capace di accompagnare l'uso quotidiano senza ansie da ricarica e un prezzo accessibile, a partire da 179,90 euro per la versione con 64 GB di storage. Lo Snapdragon 6s 4G Gen 2 e i 4 GB di RAM della configurazione più diffusa frenano però chi cerca reattività e multitasking spinto: ecco il bilancio dopo due settimane di prova diretta
	Peugeot Polygon Concept: ecco il futuro delle utilitarie Polygon è la concept car di Peugeot che mostra il futuro delle soluzioni del segmento B: tra design compatti e innovativi affiancati da dimensioni compatte uno scherzo dalla manovrabilità incredibile per le manovre a bassa velocità

HP blocca anche le cartucce di inchiostro originali. L'assistenza: 'sono scadute, dovete riacquistarle'

Acquisizione Apple: SigScalr chiude, gli sviluppatori passano a Cupertino

Cooler Master HAF II 500 integra le ventole più grandi mai viste per un case

I musulmani non dovrebbero usare le criptovalute per pagare: la nuova fatwa fa discutere

AMD Radeon 9000 pronte a sorpassare le NVIDIA RTX 5000? Frame generation fino a 8X nei nuovi driver

Soulframe, il nuovo gameplay chiarisce meglio identità e sistemi

La Commissione UE presenterà una proposta per vietare i social ai più giovani

Niente più eliche: con due ali, il robot del MIT può sia volare che nuotare sott'acqua

Waze si aggiorna con nuove funzioni IA: c'è anche la Motorcycle Mode

Oltre 200 economisti ed esperti di IA lanciano un appello: 'Bisogna agire ora per prepararsi all'impatto dell'intelligenza artificiale'

I migliori produttori del 2026? Facci sapere quali sono, puoi vincere una scheda video

Tutti gli articoli

Vai al Forum

Rispondi

15-02-2008, 18:43	#1
spk Senior Member Iscritto dal: Jul 2002 Città: Hampstead, London Messaggi: 2449	[Regular expression] selezionare tag html problema apparentemente banale: - ho una pagina web che non conosce il significato di "standard" - devo estrarre tramite un programma java delle informazioni da queste pagine web, procedendo ad albero con determinati link selezionati dalla prima pagina le soluzioni sono molteplici: parserHTML, dom, sax, parser manuale (in ordine di complessità) tuttavia per i primi tre casi ho bisogno comunque di "ripulire" il il codice html della pagina dalla tonnellata di sporcizie, per poter passare il file al parser. Basandomi sul concetto che tutto ciò che mi interessa da quella pagina è una sua versione gerarchicamente strutturata (senza necessariamente mantenere intatti tutti i tag html) ho iniziato a sostituire diverse stringhe con una versione "pulita" ed eliminando quelle "unpaired" (img e compagnia bella) tramite espressioni regolari. Il procedimento di pulitura proseguiva liscio per ogni capriccio del creatore del DOM finchè mi sono ritrovato a combattere con l'eliminazione dei tag <script> ... </script> problema 1: alcune righe del file usano il carriage return, altre il new line, altre il tab new line (nella sintassi regexp /r/n/t) il .(punto) non comprende questi caratteri problema 2: mi ritrovo alcune parentesi acute all'interno dello script, non posso utilizzare [^<]* per terminare la selezione del tag, come ho fatto per gli altri probabilmente ho fatto anche altri tentativi, ma penso di avervi detto tutto PS: se avete anche dei consigli su come risolvere il problema in modo alternativo sono molto ben accetti __________________ stabilmente instabile

Rispondi

« Discussione precedente | Discussione successiva »

	Recensione HONOR Magic V6: spessore record e sup...
	Redmi Pad 2 9.7: ampio display, economico e peso...
	Peugeot Polygon Concept: ecco il futuro delle ut...
	Reno16 Pro: il compatto di OPPO punta su fotocam...
	Hisense 55U7SE: tuttofare e accessibile, il Min...

	HP blocca anche le cartucce di inchiostr...
	Acquisizione Apple: SigScalr chiude, gli...
	Cooler Master HAF II 500 integra le vent...
	I musulmani non dovrebbero usare le crip...
	AMD Radeon 9000 pronte a sorpassare le N...
	Soulframe, il nuovo gameplay chiarisce m...
	La Commissione UE presenterà una ...
	Niente più eliche: con due ali, i...
	Waze si aggiorna con nuove funzioni IA: ...
	Oltre 200 economisti ed esperti di IA la...
	I migliori produttori del 2026? Facci sa...
	Claude Code consuma fino a 33 mila token...
	Si chiama Starfire il chip con cui Intel...
	Chrome espone l'OS reale dietro ogni ric...
	Intel investe altri 5 miliardi di euro p...

	Chromium
	GPU-Z
	OCCT
	LibreOffice Portable
	Opera One Portable
	Opera One 106
	CCleaner Portable
	CCleaner Standard
	Cpu-Z
	Driver NVIDIA GeForce 546.65 WHQL
	SmartFTP
	Trillian
	Google Chrome Portable
	Google Chrome 120
	VirtualBox

Tutti gli articoli

Tutti i download

Strumenti
Mostra una versione stampabile Invia questa pagina per email

Regole
Non Puoi aprire nuove discussioni Non Puoi rispondere ai messaggi Non Puoi allegare file Non Puoi modificare i tuoi messaggi Il codice vB è On Le Faccine sono On Il codice [IMG] è On Il codice HTML è Off

Vai al Forum

Tutti gli orari sono GMT +1. Ora sono le: 05:42.

Hisense 55U7SE: tuttofare e accessibile, il MiniLED per film, sport e gioco MiniLED di fascia media con local dimming a 192 zone, 144 Hz nativi e audio firmato Devialet. La prova strumentale riscontra colori affidabili e gaming reattivo,...

Recensione HONOR Magic V6: spessore record e super batteria. È lui il fold da battere? HONOR Magic V6 è arrivato in Italia a 2.299,90 euro con una promessa precisa: unire 4 mm di spessore da aperto (8,75 mm chiuso nel modello White, 9 mm negli altri...

Forza Horizon 6 Recensione: si vola in Giappone! Forza Horizon 6 arriva con la nuova ambientazione in Giappone, il paese più desiderato dalla community fin dal debutto della serie nel 2012. Playground Games ha...

Da oggi mirrorless full-frame Canon EOS R6 V e RF 20-50mm F4 L IS USM PZ, il meglio per i video a mano libera Disponibili da oggi sia una nuova mirrorless full-frame, Canon EOS R6 V, sia l'obiettivo RF 20-50mm F4 L IS USM PZ, il primo RF full-frame serie L con power zoom...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

L'IA cambia tutte le regole della sicurezza tra vulnerabilità e sorveglianza. Intervista al CEO di Proofpoint Abbiamo intervistato Sumit Dhawan, CEO di Proofpoint, per capire come stia cambiando il mondo della sicurezza con l'avvento dell'intelligenza artificiale e con il...

Peugeot Polygon Concept: ecco il futuro delle utilitarie Polygon è la concept car di Peugeot che mostra il futuro delle soluzioni del segmento B: tra design compatti e innovativi affiancati da dimensioni compatte uno scherzo...

Dreame X60 Pro Ultra Complete: i bracci si estendono sempre di più Dreame X60 Pro Ultra Complete implementa due bracci estensibili, per spazzola e moccio, che si spingono ben oltre quanto visto sino ad oggi permettendo una pulizia...

© 1997 - 2018 - Hardware Upgrade S.r.l. P.iva: 02560740124
Hardware Upgrade, testata giornalistica con registrazione tribunale di Varese, n. 879 del 30/07/2005. Iscrizione ROC n. 13366 - Ulteriori informazioni.
Per eventuali segnalazioni, inviare una mail all'indirizzo [email protected]