|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Junior Member
Iscritto dal: Jun 2008
Messaggi: 11
|
[Python] estrarre contenuto da file html
ciao a tutti,
ho la neccessità di estrarre contenuti da un file html abbastanza grande, ho provato ad usare HTMLParser ma non sono riuscito a fare cio che devo: Codice:
<Result documentScore="1.923871" outputMode="3">[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]]</Result> da questa line nel file html avrei la neccessita di estrarre il content sotto forma di stringa cioè: Codice:
[[Donald Duck|Donald Fauntleroy Duck]] is an [[Cartoon|American cartoon]] [[Character (arts)|character]] from [[The Walt Disney Company]] avete qualche suggerimento? grazie mille Alberto Ultima modifica di bigboss1984 : 22-03-2011 alle 15:50. |
|
|
|
|
|
#2 | |
|
Senior Member
Iscritto dal: Jul 2005
Messaggi: 736
|
Quote:
__________________
O.S.: WIN 10 64-bit CPU: INTEL I5 12400F RAM: 16 GB Corsair Vengeance LPX 3200 Mhz VGA: MSI ARMOR RX570 4GB OC MOBO: ASROCK B660M PRO RS HDD: Seagate 1TB SDD: CRUCIAL MX500 500GB ALI: BE QUIET PURE POWER CM 11 600W |
|
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: May 2004
Messaggi: 1136
|
Prova con Beautiful Soup: http://www.crummy.com/software/BeautifulSoup/
|
|
|
|
|
|
#4 |
|
Senior Member
Iscritto dal: May 2001
Messaggi: 12869
|
Python mette a disposizione le classi per gestire il DOM, comunque c'è anche la classe xml.dom.minidom che può fare al caso tuo.
Ultima modifica di WarDuck : 23-03-2011 alle 10:02. |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 20:51.




















