PDA

View Full Version : [HTML] ANSI as UTF8


paperino005
03-08-2008, 14:14
In una pagina web ho
<meta http-equiv="content-type" content="text/html; charset=utf-8" />

Usando Notepad++ mi sono accorto che mostra come encoding del file HTML, in basso a destra, ANSI

Mi confermate che non è corretto?
Se salvo la home page di google ad esempio, vedo una riga come sopra, ma Notepad++ indica charset ANSI as UTF8 (cioè quello che Notepad++ indica come UTF8 without BOM, che da quanto ho letto è il meglio per le pagine web...)

Secondo me sarebbe corretto fare da Notepad++ -> Convert to UTF8 without BOM , ma vorrei conferma da qualcuno ...

PS:
Tutto funziona bene comunque, anche se forse è sbagliato o inutile uso sempre le entities per i caratteri non ascii, ma si tratta più che altro di capire il metodo corretto di fare le cose :-)

ciao

71104
03-08-2008, 21:47
è assai probabile che il tuo file contenga solo i caratteri del sottoinsieme comune di ANSI e UTF-8, tanto più se usi le entities per caratteri partcolari, e siccome mi pare di capire che su tale file non hai messo il BOM allora può essere considerato tanto ANSI quanto UTF-8 senza BOM.

paperino005
04-08-2008, 14:30
OK.. Ho trovato inoltre nelle faq di notepad++:

I set new document opened as UTF-8 without BOM.
However, after saving the file, I close it and reopen it, it's in ANSI mode. What's going wrong?
Notepad++ "guesses" the encoding mode of the loaded file by seeing if the unicode characters is present in the file. If not, then the ANSI mode will be set automatically.

Quindi, se non c'è il BOM e non ci sono caratteri strani, UTF 8 e ANSI sono indistinguibili e convertire quindi i file di testo in UTF8 without BOM è inutile?
Solo qualora avessi di quei caratteri dovrei convertire in utf8 come dichiarato nell'html?
Ma in UTF8 le entities sono superflue? Potrei scrivere direttamente tutto o è meglio stare sul sicuro usandole?

Inoltre, BTW:
salvando la pagina dove trovo nel sorgente "&copy;" Firefox lo converte nel carattere vero e proprio.. Forse perchè essendo dichiarato UTF8, secondo FF non dovrebbero nemmeno esserci quelle entities ??
A quel punto vedo correttamente in NPP "ansi as UTF8" , ma questo rimane anche se rimuovo quel carattere, come se non fosse vero quello che dicono le faq di notepad++ ; lo stesso se salvo la home di google.it , non vedo caratteri non-ascii, ma rimane identificata come ansi as utf-8 all'apertura...

Ho letto altrove di chi mette un paio di caratteri Unicode in un commento per essere sicuro che l'editor tratti la pagina come Unicode.. Può valere la pena o è uno stratagemma inutile?