View Single Post
Old 14-05-2007, 09:35   #8
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da Matrixbob Guarda i messaggi
Ma io avevo capito che le direttive RSS2/ATOM1 permettessero solo l'escaped html.
Così la cosa si complica.
Ma effettivamente ho letto anche XHTML e quindi come dici tu, mi ci ritroverò anche l'unicode.

C'è 1 maniera x aggiustare automaticamente tutti i caratteri (magari con una qualche funzioncina) senza mettermi io a fare tutta la casistica possibile e sostituire le stirnghe?!
Giusto per capire ... tu devi scrivere o leggere un file RSS/ATOM?? E tramite quale linguaggio di programmazione?

Se devi leggere un file XML ti affiderai sicuramente ad un parser, che fa tutto lui per quanto riguarda l'interpretazione delle entità.
Se invece devi scrivere è comunque semplice. Innanzitutto devi stabilire il charset da usare. Non sei obbligato a codificare un carattere unicode come “. Se, per esempio, dichiari un charset come UTF-8, basta che mandi in output la sequenza esatta per codificare questo carattere, cioè (in hex) E2 80 9C.

È la stessa identica cosa che succede anche in HTML/XHTML. Le entità le puoi sempre mettere in qualunque caso e indipendentemente da quale charset specifichi. Poi sei libero di scrivere nel file un qualunque carattere secondo il charset specificato.
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso