|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Senior Member
Iscritto dal: Feb 2002
Città: Trento
Messaggi: 962
|
[Java] Caratteri "estesi" e la console di Windows
Buonasera a tutti,
questa volta mi è capitata una cosa davvero strana... Mi hanno chiesto di risolvere un problema: bisogna costruire una applicazione Java che scriva l'output sulla console, e che giri sotto Windows. Bene, nessun problema, qualche System.out e la cosa si risolve lì... poi però ci si accorge che i caratteri "estesi" (per intenderci, le nostre "èéòàù") vengono sostituite da altri caratteri. A questo punto interpellato, penso ad un problema di pagina codici della console, e la reimposto con "mode con: select cp=850" (prima era 437, US). Niente. Poi provo a cambiare l'encoding dei caratteri, "imbustando" lo stream in questo modo: Codice:
System.setOut(new PrintStream(System.out, false, "UTF-8")); Per curiosità, dirigo l'output su un FileOutputStream, che apro con il blocco note successivamente: magia, i caratteri sono quelli giusti! Naturalmente, sia la console interna di Eclipse (che non deve essere una "vera" console), che il terminale di Linux funzionano... Avete qualche idea? E non mi venite a dire di guardare ciò che viene scritto byte per byte, non ne ho voglia...
__________________
"Et Eärallo Endorenna utúlien. Sinome maruvan ar Hildinyar tenn' Ambar-metta!" -- Aragorn Elessar, Heir of Isildur Mixmar -- OpenSuSE 11.1 on AMD 64 3000+ on DFI LanParty nF4-D | GeForce 6600 GT + Thermaltake Schooner on Samsung 710N Storage -- ( 2 x Hitachi Deskstar 80 Gb + 1 x Hitachi 250 Gb ) = 1 RAID 5 + 1 Storage space LaCie Ethernet Disk Mini 250 Gb | HP - DV2150 EL MILAN CLAN |
|
|
|
|
|
#2 |
|
Senior Member
Iscritto dal: Nov 2004
Città: Tra Verona e Mantova
Messaggi: 4553
|
Usa la code page 1252
chcp 1252 "dovrebbe" funzionare (quanta sicurezza |
|
|
|
|
|
#3 | |
|
Senior Member
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
|
Quote:
Ci sono due punti da mettere a fuoco: - Quale è il set di caratteri impostato nella console. - Come è stato scritto il carattere speciale nel sorgente (o da dove viene preso, se altrove). Immaginando che la console sia impostata per usare il CP-850, il seguente codice: Codice:
System.setOut (new PrintStream (System.out, true, "CP850"));
System.out.println ("\u00e8");
Avrebbe funzionato anche se avessi scritto direttamente "è" nella println, ma solo perché ho scritto il codice con un editor su Windows e Windows usa il set WIN-1252. Il WIN-1252 è un superset del ISO-8859-1 e quest'ultimo mappa in modo uguale i caratteri del blocco Latin-1 del Unicode. In definitiva: si dovrebbero mettere nelle stringhe literal gli escape Unicode per scrivere dei caratteri speciali (questo in generale ... non c'entra la console). Per scrivere sulla console, si deve impostare il corretto charset.
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%) |
|
|
|
|
|
|
#4 |
|
Senior Member
Iscritto dal: Nov 2004
Città: Tra Verona e Mantova
Messaggi: 4553
|
Ritiro il mio cp1252. Ho provato a usare il codice per il simbolo dell'euro ("\u20ac") con un sorgente UTF-16 e non me lo stampa
|
|
|
|
|
|
#5 | |
|
Senior Member
Iscritto dal: Feb 2002
Città: Trento
Messaggi: 962
|
Quote:
Un'altra cosa: la codifica con cui il file di testo Java (e quindi, il compilato prodotto dal compilatore) viene salvata dipende dal S.O. e in particolare dalla sua "pagina codice", quindi dovrei aspettarmi byte diversi per lo stesso carattere in sistemi diversi: esiste la possibilità di dichiarare la mappatura utilizzata, un po' come fa XML in testa ai file? Cioè, è possibile infilare una specie di metadato con la codifica del testo, in maniera da rendere sensate le operazioni di lettura/scrittura? Mi rendo conto che la cosa è più sistemistica che programmativa, però mi incuriosisce...
__________________
"Et Eärallo Endorenna utúlien. Sinome maruvan ar Hildinyar tenn' Ambar-metta!" -- Aragorn Elessar, Heir of Isildur Mixmar -- OpenSuSE 11.1 on AMD 64 3000+ on DFI LanParty nF4-D | GeForce 6600 GT + Thermaltake Schooner on Samsung 710N Storage -- ( 2 x Hitachi Deskstar 80 Gb + 1 x Hitachi 250 Gb ) = 1 RAID 5 + 1 Storage space LaCie Ethernet Disk Mini 250 Gb | HP - DV2150 EL MILAN CLAN |
|
|
|
|
|
|
#6 | ||
|
Senior Member
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
|
Quote:
Quote:
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%) |
||
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 05:37.



















