PDA

View Full Version : delucidazione su codifica UTF-8


p0w3r3d
16-06-2013, 13:11
Salve a tutti! Ho un file di testo che apro con Notepad++ e che viene interpretato con codifica UTF-8. Nel file però, i caratteri 'à' vengono visualizzati come 'Ã'. Se provo a cambiare tipo di codifica però nessuna riesce a visualizzare la 'à' correttamente. Da cosa può dipendere?

wingman87
16-06-2013, 14:58
Facendo delle prove ho visto che in notepad++ se copi la 'à' da un file con cofica Ansi ad un file con codifica UTF-8, il carattere resta lo stesso ma cambia la codifica, in pratica dietro le quinte avviene una conversione. Infatti se dopo aver fatto questo cambi la codifica in Ansi ottieni "Ã*". Quindi secondo me il testo è stato copiato da un editor o una pagina che stava usando la codifica sbagliata (che quindi visualizzava à al posto di à) in un editor con codifica UTF-8 e quest'ultimo ha effettuato la conversione mantenendo il carattere à solo che stavolta in UTF-8. L'unico modo in cui ora puoi convertirlo è effettuando delle sostituzioni, è probabile che ci siano anche altri caratteri sbagliati.

p0w3r3d
16-06-2013, 15:09
E' quello che verrebbe da pensare anche a me se non fosse che se apro il file in Firefox (si tratta di un file HTML che contiene questa direttiva <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />), i caratteri vengono correttamente visualizzati...

wingman87
16-06-2013, 15:37
Allora non so... non riesco a riprodurre questo comportamento. Se te lo visualizza correttamente con quella direttiva dovrebbe vedersi bene anche in notepad++ con quella stessa codifica

p0w3r3d
16-06-2013, 17:56
Trovato! Il file lo aprivo come come UTF-8 ma il formato reale è ANSI. Quindi ho copiato il contenuto in un nuovo file ANSI e poi l'ho riconvertito in UTF-8. E' un passaggio che mi deve essere sfuggito facendo millemila prove :\