View Full Version : [JAVA] Codifica Stringhe in UTF8
Tiposveglio
12-12-2006, 15:02
Ciao a tutti,
ho sviluppato un'applicazione sul mio pc, ma devo farla girare su una workstation Sun.
L'applicazione visualizza delle stringhe che possono contenere caratteri accentati. Sul PC le visualizza correttamente, mentre sulla workstation SUN al posto della lettera accentata mette un ?
Se non sbaglio la workstation Sun usa il charset UTF-8 quindi ho provato a codificare le mie stringhe con questo charset ma sulla macchina Sun mi continua a visualizzare il ?
Questo è il codice che ho fatto
String s = new String("Proviamo a mettere un po' di lettere accentate: é ò à ì ù");
String s1 = null;
try {
byte [] uft8byte = s.getBytes("UTF8");
s1 = new String(uft8byte,"UTF8");
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
System.out.println(s1);
Qualcuno sa dirmi dove sbaglio? Grazie in anticipo per l'aiuto!
Qualcuno sa dirmi dove sbaglio? Grazie in anticipo per l'aiuto!Innanzitutto, anche se non l'hai menzionato, il problema ce l'hai sicuramente con l'output sulla "console" (non in una finestra grafica, per intenderci).
Ed è un bel problema, ne avevo già parlato in <questo> (http://www.hwupgrade.it/forum/showthread.php?t=1309417) thread.
Innanzitutto dovresti verificare esattamente quale set di caratteri usa la console. Non credo che sia UTF-8 (non è un set di caratteri ma una codifica!). Posso supporre che usi il 'latin-1' (ISO-8859-1) ma ovviamente non ne posso essere sicuro.
Tiposveglio
12-12-2006, 15:31
In realtà alla fine la stringa va visualizzata su una GUI come testo di un JTextField
Ho messo quel codice perchè sto facendo delle prove "stupide" con stampa su console per capire come risolvere prima di modificare il codice che crea la GUI.
In realtà alla fine la stringa va visualizzata su una GUI come testo di un JTextField
Ho messo quel codice perchè sto facendo delle prove "stupide" con stampa su console per capire come risolvere prima di modificare il codice che crea la GUI.Ok ... come non detto, avevo capito male io.
La questione è diversa, allora. Su una interfaccia grafica l'unico limite è il font di carattere utilizzato ma non ci dovrebbero essere problemi per le semplici lettere accentate.
Dipende quindi da come le codifichi nel sorgente! Se metti semplicemente "à è ì ò ù" va pure bene, ma assicurati che il compilatore javac utilizzi lo stesso charset dell'editor che usi.
In ogni caso, se metti ad esempio "\u00e8" ottieni sicuramente una 'è'.
Tiposveglio
12-12-2006, 16:05
Ok ... come non detto, avevo capito male io.
Avevi capito benissimo invece perchè il codice che avevo riportato io era decisamente da console!
Dipende quindi da come le codifichi nel sorgente! Se metti semplicemente "à è ì ò ù" va pure bene, ma assicurati che il compilatore javac utilizzi lo stesso charset dell'editor che usi.
Il problema è un po' più complicato perchè le stringhe che devo visualizzare mi arrivano da un componente remoto tramite un messaggio xml codificato con ISO-8859-1 che gestisco tramite una specifica classe.
Probabilmente devo solo capire che set di caratteri usa la macchina Sun e poi devo prendere le stringhe e codificarle secondo quel set di caratteri tramite la classe import java.nio.charset.Charset ed i metodi "encode" e "decode".
Il problema è un po' più complicato perchè le stringhe che devo visualizzare mi arrivano da un componente remoto tramite un messaggio xml codificato con ISO-8859-1 che gestisco tramite una specifica classe.
Probabilmente devo solo capire che set di caratteri usa la macchina Sun e poi devo prendere le stringhe e codificarle secondo quel set di caratteri tramite la classe import java.nio.charset.Charset ed i metodi "encode" e "decode".Ok, allora come ho già detto: su una interfaccia utente grafica hai meno problemi. Se non stai usando un qualche font di carattere strano, ad esempio un true-type che non ha i caratteri accentati o roba del genere, non dovresti avere grossi problemi. Se dentro la stringa c'è un carattere con codice \u00e8, per esempio, deve per forza visualizzare una 'è'.
Il problema, visto che parli di XML, semmai potrebbe essere a monte. Che cosa usi per leggere il messaggio xml?? Con quale encoding viene inviato il messaggio? Nella dichiarazione dell'xml è specificato il charset??
Tiposveglio
12-12-2006, 16:55
Se non stai usando un qualche font di carattere strano, ad esempio un true-type che non ha i caratteri accentati o roba del genere, non dovresti avere grossi problemi. Se dentro la stringa c'è un carattere con codice \u00e8, per esempio, deve per forza visualizzare una 'è'.
Non ho modificato il font, sto usando quello di default e ti assicuro che sulla macchina Sun mi mette un ? al posto di una qualsiasi lettera accentata!
Che cosa usi per leggere il messaggio xml
Purtroppo questo non te lo posso dire perchè è una tecnologia proprietaria della società per cui lavoro (figurati non l'ho visto neanche io il codice!).
Con quale encoding viene inviato il messaggio
ISO8859-1
ed il charset non è specificato!
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.