Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Polestar 3 Performance, test drive: comodità e potenza possono convivere
Polestar 3 Performance, test drive: comodità e potenza possono convivere
Abbiamo passato diversi giorni alla guida di Polestar 3, usata in tutti i contesti. Come auto di tutti i giorni è comodissima, ma se si libera tutta la potenza è stupefacente
Qualcomm Snapdragon X2 Elite: l'architettura del SoC per i notebook del 2026
Qualcomm Snapdragon X2 Elite: l'architettura del SoC per i notebook del 2026
In occasione del proprio Architecture Deep Dive 2025 Qualcomm ha mostrato in dettaglio l'architettura della propria prossima generazione di SoC destinati ai notebook Windows for ARM di prossima generazione. Snapdragon X2 Elite si candida, con sistemi in commercio nella prima metà del 2026, a portare nuove soluzioni nel mondo dei notebook sottili con grande autonomia
Recensione DJI Mini 5 Pro: il drone C0 ultra-leggero con sensore da 1 pollice
Recensione DJI Mini 5 Pro: il drone C0 ultra-leggero con sensore da 1 pollice
DJI Mini 5 Pro porta nella serie Mini il primo sensore CMOS da 1 pollice, unendo qualità d'immagine professionale alla portabilità estrema tipica di tutti i prodotti della famiglia. È un drone C0, quindi in un peso estremamente contenuto e che non richiede patentino, propone un gimbal rotabile a 225 gradi, rilevamento ostacoli anche notturno e autonomia fino a 36 minuti. Caratteristiche che rendono il nuovo drone un riferimento per creator e appassionati
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 22-03-2011, 15:48   #1
bigboss1984
Junior Member
 
Iscritto dal: Jun 2008
Messaggi: 11
[Python] estrarre contenuto da file html

ciao a tutti,
ho la neccessità di estrarre contenuti da un file html abbastanza grande, ho provato ad usare HTMLParser ma non sono riuscito a fare cio che devo:

Codice:
<Result documentScore="1.923871" outputMode="3">[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]</Result>

da questa line nel file html avrei la neccessita di estrarre il content sotto forma di stringa cioè:

Codice:
[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]
esiste qualche funzione che lo fa oppure devo farmela da solo?
avete qualche suggerimento?

grazie mille
Alberto

Ultima modifica di bigboss1984 : 22-03-2011 alle 15:50.
bigboss1984 è offline   Rispondi citando il messaggio o parte di esso
Old 22-03-2011, 16:11   #2
DoctorT
Senior Member
 
Iscritto dal: Jul 2005
Messaggi: 736
Quote:
Originariamente inviato da bigboss1984 Guarda i messaggi
ciao a tutti,
ho la neccessità di estrarre contenuti da un file html abbastanza grande, ho provato ad usare HTMLParser ma non sono riuscito a fare cio che devo:

Codice:
<Result documentScore="1.923871" outputMode="3">[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]</Result>

da questa line nel file html avrei la neccessita di estrarre il content sotto forma di stringa cioè:

Codice:
[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]
esiste qualche funzione che lo fa oppure devo farmela da solo?
avete qualche suggerimento?

grazie mille
Alberto
se il file è in XHTML (cioè è in XML "ben formato") puoi usare la classe elementtree che è nella libreria standard delle ultime versioni di python
__________________
O.S.: WIN 10 64-bit CPU: INTEL I5 12400F RAM: 16 GB Corsair Vengeance LPX 3200 Mhz VGA: MSI ARMOR RX570 4GB OC MOBO: ASROCK B660M PRO RS HDD: Seagate 1TB SDD: CRUCIAL MX500 500GB ALI: BE QUIET PURE POWER CM 11 600W
DoctorT è offline   Rispondi citando il messaggio o parte di esso
Old 22-03-2011, 23:40   #3
Johnn
Senior Member
 
Iscritto dal: May 2004
Messaggi: 1136
Prova con Beautiful Soup: http://www.crummy.com/software/BeautifulSoup/
Johnn è offline   Rispondi citando il messaggio o parte di esso
Old 23-03-2011, 10:00   #4
WarDuck
Senior Member
 
L'Avatar di WarDuck
 
Iscritto dal: May 2001
Messaggi: 12869
Python mette a disposizione le classi per gestire il DOM, comunque c'è anche la classe xml.dom.minidom che può fare al caso tuo.

Ultima modifica di WarDuck : 23-03-2011 alle 10:02.
WarDuck è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Polestar 3 Performance, test drive: comodità e potenza possono convivere Polestar 3 Performance, test drive: comodit&agra...
Qualcomm Snapdragon X2 Elite: l'architettura del SoC per i notebook del 2026 Qualcomm Snapdragon X2 Elite: l'architettura del...
Recensione DJI Mini 5 Pro: il drone C0 ultra-leggero con sensore da 1 pollice Recensione DJI Mini 5 Pro: il drone C0 ultra-leg...
ASUS Expertbook PM3: il notebook robusto per le aziende ASUS Expertbook PM3: il notebook robusto per le ...
Test ride con Gowow Ori: elettrico e off-road vanno incredibilmente d'accordo Test ride con Gowow Ori: elettrico e off-road va...
ESA: rilevati 40 mila asteroidi vicino a...
La batteria salva fabbriche di EQORE ott...
SpaceX Starship: iniziati i test della t...
Datacenter IA nello spazio entro 5 anni,...
Telescopio spaziale James Webb: rilevato...
Ericsson Mobility Report: nel 2025 il 5G...
PLAI DEMO DAY: si chiude il secondo cicl...
Google rilascia Nano Banana Pro: il nuov...
ChatGPT si rinnova ancora: disponibile l...
Ring lancia super sconti di Black Friday...
Black Friday 2025: 450 euro di sconto su...
Tutte le offerte Blink in un unico posto...
OpenAI e Foxconn uniscono le forze per r...
Ricarica delle auto elettriche in 3 minu...
Lucid presenta Gravity Touring, il SUV e...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 20:51.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v