...Java...formattazione testo...

ally · 18-06-2007, 16:10

...esiste una maniera veloce per formattare il testo permettendo solo determinati caratteri?...vorrei evitare l'uso di indexOf charAt etc...

...grazie ciao...

andbin · 18-06-2007, 16:24

Quote:

Originariamente inviato da ally

...esiste una maniera veloce per formattare il testo permettendo solo determinati caratteri?...vorrei evitare l'uso di indexOf charAt etc...

Cioè? Puoi fare un esempio?

ally · 18-06-2007, 16:35

...certamente...

Codice:

Prendimi cosÃƒÆ’Ã‚Â¬

...dovrebbe risultare Prendimi cos...o meglio ancora diventare Prendimi così...

...grazie ciao...

ally · 18-06-2007, 16:38

...dovrei formattare il contenuto di un db mal importato...nei limiti del possibile naturalmente...

...grazie ciao...

andbin · 18-06-2007, 16:47

Quote:

Originariamente inviato da ally

Codice:

Prendimi cosÃƒÆ’Ã‚Â¬

...dovrebbe risultare Prendimi cos...o meglio ancora diventare Prendimi così...

Beh, allora non mi sembra tanto una questione di "formattazione" ma un problema legato alla codifica dei caratteri!

ally · 18-06-2007, 16:54

...si scusami...hai ragione...come è possibile risalire alla codifica di appartenenza?...e come è possibile ricodificare i caratteri?...

...grazie ciao...

andbin · 18-06-2007, 17:05

Quote:

Originariamente inviato da ally

...si scusami...hai ragione...come è possibile risalire alla codifica di appartenenza?...e come è possibile ricodificare i caratteri?...

Puoi fare qualche altro esempio di stringa errata indicando anche come dovrebbe essere??

Così ... ad occhio nella stringa "ÃƒÆ’Ã‚Â¬" i caratteri che ho marcato in rosso sembrano tanto il byte iniziale di una codifica UTF-8. Il resto però non mi quadra molto ....

ally · 18-06-2007, 17:12

...queste stringhe sono derivate da una migrazione di in un db Sql Server a mySql...di piu' non so dirti sull'origine dei dati...

Codice:

ÃƒÆ’  => à

ÃƒÆ’Ã‚Â² =>  ò

ÃƒÆ’Ã‚Â¨ => è

...grazie ciao...

ally · 18-06-2007, 17:16

...in altre tabelle pero sembra che ci sia una diversa codifica...

Codice:

PiÃ¹ => piu'

Non Ãˆ => non è

AmerÃ² => amerò

...grazie ciao...

andbin · 18-06-2007, 20:13

Quote:

Originariamente inviato da ally

Codice:

PiÃ¹ => piu'

Non Ãˆ => non è

AmerÃ² => amerò

Partiamo da questo caso che è più semplice:

In PiÃ¹ ci sono 2 caratteri per codificare la 'ù': 'Ã' ha codice U+00C3 e '¹' ha codice U+00B9. Nella codifica UTF-8 la sequenza C3h B9h codifica il carattere unicode U+00F9, cioè proprio la lettera 'ù'.
Le altre due parole sono allo stesso modo.

Quote:

Originariamente inviato da ally

Codice:

ÃƒÆ’  => à

ÃƒÆ’Ã‚Â² =>  ò

ÃƒÆ’Ã‚Â¨ => è

Questo è più tosto ... non sono ancora riuscito a capire bene. Credo che siano avvenute diverse transcodifiche in sequenza, altrimenti non riuscirei a capire come una 'è' sia diventata ben 8 caratteri. Che tra l'altro, presi a coppie, "sembrano" pure loro in UTF-8 (ma il secondo carattere di ogni coppia comunque mi sembra strano).

ally · 18-06-2007, 20:59

...mh...penso cha la sostituzione delle stringhe in un carattere specifico sia la strada migliore per sistemare la questione...formattero' prima l'ipotetica utf-8 per poi sistemare il caso piu' semplice...tutto questo dovrebbe riguardare solo le lettere accentuate alla fine vero?...

...grazie ciao...

18-06-2007, 16:10	#1
ally Bannato Iscritto dal: Jan 2003 Città: Messaggi: 4423	...Java...codifica dei caratteri... ...esiste una maniera veloce per formattare il testo permettendo solo determinati caratteri?...vorrei evitare l'uso di indexOf charAt etc... ...grazie ciao... Ultima modifica di ally : 18-06-2007 alle 17:21. Motivo: ...titolo inesatto...grazie andbin...

18-06-2007, 16:35	#3
ally Bannato Iscritto dal: Jan 2003 Città: Messaggi: 4423	...certamente... Codice: Prendimi cosÃƒÆ’Ã‚Â¬ ...dovrebbe risultare Prendimi cos...o meglio ancora diventare Prendimi così... ...grazie ciao...

18-06-2007, 17:12	#8
ally Bannato Iscritto dal: Jan 2003 Città: Messaggi: 4423	...queste stringhe sono derivate da una migrazione di in un db Sql Server a mySql...di piu' non so dirti sull'origine dei dati... Codice: ÃƒÆ’ => à ÃƒÆ’Ã‚Â² => ò ÃƒÆ’Ã‚Â¨ => è ...grazie ciao...

18-06-2007, 17:16	#9
ally Bannato Iscritto dal: Jan 2003 Città: Messaggi: 4423	...in altre tabelle pero sembra che ci sia una diversa codifica... Codice: PiÃ¹ => piu' Non Ãˆ => non è AmerÃ² => amerò ...grazie ciao...

18-06-2007, 16:38	#4
ally Bannato Iscritto dal: Jan 2003 Città: Messaggi: 4423	...dovrei formattare il contenuto di un db mal importato...nei limiti del possibile naturalmente... ...grazie ciao...

18-06-2007, 16:54	#6
ally Bannato Iscritto dal: Jan 2003 Città: Messaggi: 4423	...si scusami...hai ragione...come è possibile risalire alla codifica di appartenenza?...e come è possibile ricodificare i caratteri?... ...grazie ciao...

18-06-2007, 20:59	#11
ally Bannato Iscritto dal: Jan 2003 Città: Messaggi: 4423	...mh...penso cha la sostituzione delle stringhe in un carattere specifico sia la strada migliore per sistemare la questione...formattero' prima l'ipotetica utf-8 per poi sistemare il caso piu' semplice...tutto questo dovrebbe riguardare solo le lettere accentuate alla fine vero?... ...grazie ciao...

Strumenti
Mostra una versione stampabile Invia questa pagina per email