Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Tastiera gaming MSI GK600 TKL: switch hot-swap, display LCD e tre modalità wireless
Tastiera gaming MSI GK600 TKL: switch hot-swap, display LCD e tre modalità wireless
MSI FORGE GK600 TKL WIRELESS: switch lineari hot-swap, tripla connettività, display LCD e 5 strati di fonoassorbimento. Ottima in gaming, a 79,99 euro
DJI Osmo Pocket 4: la gimbal camera tascabile cresce e ha nuovi controlli fisici
DJI Osmo Pocket 4: la gimbal camera tascabile cresce e ha nuovi controlli fisici
DJI porta un importante aggiornamento alla sua linea di gimbal camera tascabili con Osmo Pocket 4: sensore CMOS da 1 pollice rinnovato, gamma dinamica a 14 stop, profilo colore D-Log a 10 bit, slow motion a 4K/240fps e 107 GB di archiviazione integrata. Un prodotto pensato per i creator avanzati, ma che convince anche per l'uso quotidiano
Sony INZONE H6 Air: il primo headset open-back di Sony per giocatori
Sony INZONE H6 Air: il primo headset open-back di Sony per giocatori
Il primo headset open-back della linea INZONE arriva a 200 euro con driver derivati dalle cuffie da studio MDR-MV1 e un peso record di soli 199 grammi
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 22-03-2011, 14:48   #1
bigboss1984
Junior Member
 
Iscritto dal: Jun 2008
Messaggi: 11
[Python] estrarre contenuto da file html

ciao a tutti,
ho la neccessità di estrarre contenuti da un file html abbastanza grande, ho provato ad usare HTMLParser ma non sono riuscito a fare cio che devo:

Codice:
<Result documentScore="1.923871" outputMode="3">[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]</Result>

da questa line nel file html avrei la neccessita di estrarre il content sotto forma di stringa cioè:

Codice:
[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]
esiste qualche funzione che lo fa oppure devo farmela da solo?
avete qualche suggerimento?

grazie mille
Alberto

Ultima modifica di bigboss1984 : 22-03-2011 alle 14:50.
bigboss1984 è offline   Rispondi citando il messaggio o parte di esso
Old 22-03-2011, 15:11   #2
DoctorT
Senior Member
 
Iscritto dal: Jul 2005
Messaggi: 738
Quote:
Originariamente inviato da bigboss1984 Guarda i messaggi
ciao a tutti,
ho la neccessità di estrarre contenuti da un file html abbastanza grande, ho provato ad usare HTMLParser ma non sono riuscito a fare cio che devo:

Codice:
<Result documentScore="1.923871" outputMode="3">[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]</Result>

da questa line nel file html avrei la neccessita di estrarre il content sotto forma di stringa cioè:

Codice:
[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]
esiste qualche funzione che lo fa oppure devo farmela da solo?
avete qualche suggerimento?

grazie mille
Alberto
se il file è in XHTML (cioè è in XML "ben formato") puoi usare la classe elementtree che è nella libreria standard delle ultime versioni di python
__________________
O.S.: WIN 10 64-bit CPU: INTEL I5 12400F RAM: 16 GB Corsair Vengeance LPX 3200 Mhz VGA: MSI ARMOR RX570 4GB OC MOBO: ASROCK B660M PRO RS HDD: Seagate 1TB SDD: CRUCIAL MX500 500GB ALI: BE QUIET PURE POWER CM 11 600W
DoctorT è offline   Rispondi citando il messaggio o parte di esso
Old 22-03-2011, 22:40   #3
Johnn
Senior Member
 
Iscritto dal: May 2004
Messaggi: 1136
Prova con Beautiful Soup: http://www.crummy.com/software/BeautifulSoup/
Johnn è offline   Rispondi citando il messaggio o parte di esso
Old 23-03-2011, 09:00   #4
WarDuck
Senior Member
 
L'Avatar di WarDuck
 
Iscritto dal: May 2001
Messaggi: 12966
Python mette a disposizione le classi per gestire il DOM, comunque c'è anche la classe xml.dom.minidom che può fare al caso tuo.

Ultima modifica di WarDuck : 23-03-2011 alle 09:02.
WarDuck è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Tastiera gaming MSI GK600 TKL: switch hot-swap, display LCD e tre modalità wireless Tastiera gaming MSI GK600 TKL: switch hot-swap, ...
DJI Osmo Pocket 4: la gimbal camera tascabile cresce e ha nuovi controlli fisici DJI Osmo Pocket 4: la gimbal camera tascabile cr...
Sony INZONE H6 Air: il primo headset open-back di Sony per giocatori Sony INZONE H6 Air: il primo headset open-back d...
Nutanix cambia pelle: dall’iperconvergenza alla piattaforma full stack per cloud ibrido e IA Nutanix cambia pelle: dall’iperconvergenza alla ...
Recensione Xiaomi Pad 8 Pro: potenza bruta e HyperOS 3 per sfidare la fascia alta Recensione Xiaomi Pad 8 Pro: potenza bruta e Hyp...
Spento lo strumento LECP della sonda spa...
Voyager Technologies ha siglato un accor...
GoPro annuncia la linea MISSION 1 con tr...
Alcune varianti dei futuri Samsung Galax...
Il ridimensionamento di OnePlus in Europ...
Il cofondatore di Netflix ha lasciato l'...
ASUS porta in Italia il nuovo Zenbook Du...
Assassin's Creed: Black Flag Resynced, s...
Xbox Game Pass cambierà: tra le n...
I nuovi Surface Pro e Laptop sono vicini...
OnePlus ci riprova con la fascia bassa: ...
La Top 10 delle offerte Amazon del weeke...
XGIMI MoGo 2 Pro a 339€: Google TV con N...
Forum IT & Intelligence 2026: dall'A...
iPhone 16e per la prima volta a meno di ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 22:54.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v