|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Senior Member
Iscritto dal: Dec 2005
Messaggi: 558
|
[python] problema con urllib.urlretrieve()
ola
sto scrivendo un programmino semplice semplice che permette di scaricare testi di canzoni dal web. Utilizzao urlretrieve per scaricare la pagina html contenente il testo, che poi passo ad un parser che mi tira fuori quello che mi serve. Ho un unico problema: quando nella pagina sono contenute lettere accentate, quando vado a salvarmi la pagina queste si trasformano in caratteri malsani (lettere accentate -> strane lettere con dieresi ecc). Se mi vado a vedere la sorgente direttamente da un browser questo (ovviamente In pratica credo che urlretrieve faccia questi casini, volevo sapere se c'è un modo per evitare questo problema, o almeno una qualche soluzione (anche zozza |
|
|
|
|
|
#2 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Non è un problema di urlretrieve, ma di codifica. L'API che usi ti ritorna i dati "grezzi", cioé esattamente come li passa il server.
Poi bisogna che tipo di codifica viene usata per visualizzare correttamente le informazioni. Molto probabilmente la codifica usata sarà UTF-8, per cui devi convertire la stringa che hai ottenuto usando questa codifica. Prova con s.decode('utf-8') oppure con s.decode('utf8') e vedi se riesci a risolvere.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Dec 2005
Messaggi: 558
|
grande! spulciando un po' di roba sul web sono riuscito a risolvere utilizzando unicode(stringa, "utf-8") e stringa.encode("utf-8") per ritornare indietro!
grazie mille! |
|
|
|
|
|
#4 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Ma figurati: è un piacere aiutarti, se possibile.
Sull'argomento Python & Unicode avevo conservato un link molto chiaro ed esaustivo. Ecco qui: http://www.amk.ca/python/howto/unicode spero possa esserti utile.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 14:22.



















