Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Recensione vivo X300 Pro: è ancora lui il re della fotografia mobile, peccato per la batteria
Recensione vivo X300 Pro: è ancora lui il re della fotografia mobile, peccato per la batteria
vivo X300 Pro rappresenta un'evoluzione misurata della serie fotografica del produttore cinese, con un sistema di fotocamere migliorato, chipset Dimensity 9500 di ultima generazione e l'arrivo dell'interfaccia OriginOS 6 anche sui modelli internazionali. La scelta di limitare la batteria a 5.440mAh nel mercato europeo, rispetto ai 6.510mAh disponibili altrove, fa storcere un po' il naso
Lenovo Legion Go 2: Ryzen Z2 Extreme e OLED 8,8'' per spingere gli handheld gaming PC al massimo
Lenovo Legion Go 2: Ryzen Z2 Extreme e OLED 8,8'' per spingere gli handheld gaming PC al massimo
Lenovo Legion Go 2 è la nuova handheld PC gaming con processore AMD Ryzen Z2 Extreme (8 core Zen 5/5c, GPU RDNA 3.5 16 CU) e schermo OLED 8,8" 1920x1200 144Hz. È dotata anche di controller rimovibili TrueStrike con joystick Hall effect e una batteria da 74Wh. Rispetto al dispositivo che l'ha preceduta, migliora ergonomia e prestazioni a basse risoluzioni, ma pesa 920g e costa 1.299€ nella configurazione con 32GB RAM/1TB SSD e Z2 Extreme
AWS re:Invent 2025: inizia l'era dell'AI-as-a-Service con al centro gli agenti
AWS re:Invent 2025: inizia l'era dell'AI-as-a-Service con al centro gli agenti
A re:Invent 2025, AWS mostra un’evoluzione profonda della propria strategia: l’IA diventa una piattaforma di servizi sempre più pronta all’uso, con agenti e modelli preconfigurati che accelerano lo sviluppo, mentre il cloud resta la base imprescindibile per governare dati, complessità e lock-in in uno scenario sempre più orientato all’hybrid cloud
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 12-12-2008, 10:52   #1
avastreg
Senior Member
 
L'Avatar di avastreg
 
Iscritto dal: Sep 2007
Messaggi: 316
[Python] Encoding di una stringa letta da file

Ciao a tutti,

mi sto avvicinando pian piano a Python facendo vari script e test; sono su windows e uso SPE.

Stavo testando un po' la lettura da file e la successiva elaborazione delle stringhe ottenute, ma ho un problema con l'encoding.

Per maggior chiarezza posto il (poco) codice e l'output che vorrei encodare/decodare (ancora non l'ho capito)

Codice:
import os.path

f = open("C:\\inferno.txt","r")

print f.encoding # risulta none
canti = [[] for i in range(100)] #forse questa è inutile ma vabbè

i = 0

for line in f.readlines():
    if line.find("CANTO") != -1:
        i = i + 1
    canti[i].append(line)
line.encode("ascii")
print canti[3]

f.close()
l'output è questo

Codice:
['CANTO III\n', "[Canto terzo, nel quale tratta de la porta e de l'entrata de l'inferno e del fiume d'Acheronte, de la pena di coloro che vissero sanza opere di fama degne, e come il demonio Caron li trae in sua nave e come elli parl\xc3\xb2 a l'auttore; e tocca qui questo vizio ne la persona di papa Cilestino.]\n", "'Per me si va ne la citt\xc3\xa0 dolente,\n", ......
etc etc.

Il problema sono le lettere strane/accentate che non capisco come debbano essere trattate

Ho tentato con un line.encode('utf_8') ma ottengo questo errore:

Codice:
line.encode("utf_8")
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 138: ordinal not in range(128)
Perchè dice 'ascii'? googlando non sono giunto a conclusioni utili

Grazie in anticipo
avastreg è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2008, 13:45   #2
DanieleC88
Senior Member
 
L'Avatar di DanieleC88
 
Iscritto dal: Jun 2002
Città: Dublin
Messaggi: 5989
Quote:
Originariamente inviato da avastreg Guarda i messaggi
Codice:
    canti[i].append(line)
Prova ad usare canti[i].append(unicode(line)), anche se non sono sicuro che faccia al caso tuo.

ciao
__________________

C'ho certi cazzi Mafa' che manco tu che sei pratica li hai visti mai!
DanieleC88 è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2008, 14:40   #3
avastreg
Senior Member
 
L'Avatar di avastreg
 
Iscritto dal: Sep 2007
Messaggi: 316
Quote:
Originariamente inviato da DanieleC88 Guarda i messaggi
Prova ad usare canti[i].append(unicode(line)), anche se non sono sicuro che faccia al caso tuo.

ciao
grazie,

purtroppo mi da lo stesso errore

Codice:
canti[i].append(unicode(line))
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 138: ordinal not in range(128)
avastreg è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2008, 15:16   #4
Mindflyer
Member
 
L'Avatar di Mindflyer
 
Iscritto dal: Nov 2007
Messaggi: 88
Quote:
Originariamente inviato da avastreg Guarda i messaggi
Ho tentato con un line.encode('utf_8') ma ottengo questo errore:
Prova con:
Codice:
line.encode('latin-1')
__________________
PC: Windows Vista SP2 Home Premium & Ubuntu Karmic Koala 9.10 | Intel DP35DP | Intel Core 2 Quad Q6600 | 2x2048 Kingston DDR2 667mhz DualChannel | XFX Nvidia GeForce 8500GT | Seagate Barracuda 7200.10 & 7200.12 500GB SataII | Acer AL1916W
Mindflyer è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2008, 17:15   #5
avastreg
Senior Member
 
L'Avatar di avastreg
 
Iscritto dal: Sep 2007
Messaggi: 316
Quote:
Originariamente inviato da Mindflyer Guarda i messaggi
Prova con:
Codice:
line.encode('latin-1')
stesso errore anche con latin-1.. ma come è possibile! è strano..
avastreg è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2008, 18:35   #6
banryu79
Senior Member
 
L'Avatar di banryu79
 
Iscritto dal: Oct 2007
Città: Padova
Messaggi: 4131
utf_16 ?
__________________

As long as you are basically literate in programming, you should be able to express any logical relationship you understand.
If you don’t understand a logical relationship, you can use the attempt to program it as a means to learn about it.
(Chris Crawford)
banryu79 è offline   Rispondi citando il messaggio o parte di esso
Old 14-12-2008, 08:50   #7
cdimauro
Senior Member
 
L'Avatar di cdimauro
 
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
Quote:
Originariamente inviato da avastreg Guarda i messaggi
Ciao a tutti,

mi sto avvicinando pian piano a Python facendo vari script e test; sono su windows e uso SPE.

Stavo testando un po' la lettura da file e la successiva elaborazione delle stringhe ottenute, ma ho un problema con l'encoding.

Per maggior chiarezza posto il (poco) codice e l'output che vorrei encodare/decodare (ancora non l'ho capito)

Codice:
import os.path

f = open("C:\\inferno.txt","r")

print f.encoding # risulta none
canti = [[] for i in range(100)] #forse questa è inutile ma vabbè

i = 0

for line in f.readlines():
    if line.find("CANTO") != -1:
        i = i + 1
    canti[i].append(line)
line.encode("ascii")
print canti[3]

f.close()
l'output è questo

Codice:
['CANTO III\n', "[Canto terzo, nel quale tratta de la porta e de l'entrata de l'inferno e del fiume d'Acheronte, de la pena di coloro che vissero sanza opere di fama degne, e come il demonio Caron li trae in sua nave e come elli parl\xc3\xb2 a l'auttore; e tocca qui questo vizio ne la persona di papa Cilestino.]\n", "'Per me si va ne la citt\xc3\xa0 dolente,\n", ......
etc etc.

Il problema sono le lettere strane/accentate che non capisco come debbano essere trattate

Ho tentato con un line.encode('utf_8') ma ottengo questo errore:

Codice:
line.encode("utf_8")
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 138: ordinal not in range(128)
Perchè dice 'ascii'? googlando non sono giunto a conclusioni utili

Grazie in anticipo
Con le codifiche bisogna stare molto attenti perché è facile confondersi e perdersi fra cosa è codificato in quale tipo di codifica e quale codifica vorrei ottenere da un'altra. Visto che c'ho sbattuto non poco la testa, rispondo riportando la mia esperienza in merito.

Python ha due tipi di stringhe (tranne con la versione 3.0, ma per il momento non ne parliamo): sequenze di byte e unicode. Nel primo caso possiamo manipolare "buffer" senza occuparci della codifica: sono byte "grezzi". Nel secondo caso gli unici caratteri supportati sono quelli che hanno una codifica Unicode corretta.

Fortunatamente in Python il problema della codifica e decodifica è stato risolto molto bene grazie a un sistema di codec da e verso i quali è possibile effettuate le conversioni.

Vi risparmio la teoria e passiamo subito alla pratica col caso sollevato qui, in modo da capire immediatamente come sfruttare questi strumenti.

Innanzitutto bisogna capire bene qual è la codifica del file letto. Dall'output incollato:
Codice:
"[Canto terzo, nel quale tratta de la porta e de l'entrata de l'inferno e del fiume d'Acheronte, de la pena di coloro che vissero sanza opere di fama degne, e come il demonio Caron li trae in sua nave e come elli parl\xc3\xb2 a l'auttore; e tocca qui questo vizio ne la persona di papa Cilestino.]\n"
facendo qualche prova ho capito che si trattava di utf8.

Questo significa che se prendo la stringa così com'è e la stampo a video, ottengo dei caratteri strani a video, perché Python di default imposta la codifica di sistema. Quindi se prendo quella stringa e la codifica di default è latin1, eseguendo un print mi aspetto che i byte C3 e B2 in esadecimale rappresentino dei validi caratteri latin1, cp1252 o altro (a seconda del codepage impostato).

Questo non è vero, perché, appunto si tratta di una codifica utf8. Cosa dobbiamo fare quindi per poter stampare correttamente quei dati? Bisogna convertire lo stream di byte utf8 in una stringa unicode, e questo lo si fa col metodo decode della stringhe, specificando qual è l'encoding dello stream che si vuole convertire:
Codice:
s.decode('utf-8')
dove s è la stringa di byte e 'utf-8' è il suo encoding attuale.

In questo modo otteniamo una stringa unicode, che Python può gestire tranquillamente a seconda della codifica di default impostata nel sistema. Questo significa che se cercate di stamparla Python provvederà automaticamente a effettuare le opportune conversioni per ottenere un output corretto.

A parte questo se, ad esempio, volessimo ricodificare la stringa in latin1, ad esempio, l'operazione da fare è semplicissima:
Codice:
u.encode('latin1')
posto che u sia la stringa unicode (ottenuta con s.decode('utf-8')) e che latin1 sia l'encoding finale che si vuol ottenere.

Dopo quest'operazione, se tutto va bene (spiego dopo il perché), siamo sicuri che lo stream di byte ottenuto sia codificato in latin1.

Dicevo prima se tutto va bene, perché non è detto che una codifica (ma anche una decodifica) possa essere eseguita correttamente. Basti provare a convertire la stringa di cui sopra in ascii, ad esempio:
Codice:
>>> print s.decode('utf-8').encode('ascii')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf2' in position 216: ordinal not in range(128)
Questo perché la codifica ascii NON prevede nessun simbolo per il carattere "ò".

In questi casi Python prevede il sollevamento di un'eccezione, ma è possibile modificarne il comportamento (ad esempio ignorando o rimpiazzando i caratteri non codificabili) specificando cosa fare col secondo parametro (opzionale) di encode o decode.

E' tutto. Se ci sono dubbi chiedete pure.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro
@LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro
Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys

Ultima modifica di cdimauro : 14-12-2008 alle 08:52.
cdimauro è offline   Rispondi citando il messaggio o parte di esso
Old 15-12-2008, 09:33   #8
avastreg
Senior Member
 
L'Avatar di avastreg
 
Iscritto dal: Sep 2007
Messaggi: 316
grazie cdimauro, si aspettava un (tuo) intervento chiarificatore!

nel weekend ho poi risolto proprio con s.decode('utf_8'), ma facendo vari tentativi pseudo a caso.

Il perchè dell'errore l'ho letto qui, documento interessante.
avastreg è offline   Rispondi citando il messaggio o parte di esso
Old 15-12-2008, 09:36   #9
cdimauro
Senior Member
 
L'Avatar di cdimauro
 
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
Figurati: è un piacere dare una mano, quando posso.

Quel link l'avevo letto tempo fa ed è proprio quello che mi ha illuminato sulla questione.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro
@LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro
Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys
cdimauro è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Recensione vivo X300 Pro: è ancora lui il re della fotografia mobile, peccato per la batteria Recensione vivo X300 Pro: è ancora lui il...
Lenovo Legion Go 2: Ryzen Z2 Extreme e OLED 8,8'' per spingere gli handheld gaming PC al massimo Lenovo Legion Go 2: Ryzen Z2 Extreme e OLED 8,8'...
AWS re:Invent 2025: inizia l'era dell'AI-as-a-Service con al centro gli agenti AWS re:Invent 2025: inizia l'era dell'AI-as-a-Se...
Cos'è la bolla dell'IA e perché se ne parla Cos'è la bolla dell'IA e perché se...
BOOX Palma 2 Pro in prova: l'e-reader diventa a colori, e davvero tascabile BOOX Palma 2 Pro in prova: l'e-reader diventa a ...
Dal MIT una nuova batteria per auto elet...
Adam Mosseri parla di IA su Instagram: l...
Suonerie personalizzate e Tone Store: il...
LG UltraGear evo: svelati i monitor gami...
Nelle offerte Amazon del nuovo anno ci s...
Meta Quest 3 da 512 GB torna a 469€ con ...
Steam a inizio 2026: i giochi più vendut...
Auto sempre al top: compressore Xiaomi, ...
In Francia si ragiona sul ban dei social...
Tesla Model Y è l'auto più...
Il caricatore definitivo, ok anche coi M...
Amazon Haul rilancia: sconti automatici ...
Upgrade PC a prezzi ribassati: Amazon sc...
Nel mirino dell'Europa ci sono caminetti...
2 portatili super su Amazon: quello con ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 12:25.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v