Quote:
Originariamente inviato da Matrixbob
Ma io avevo capito che le direttive RSS2/ATOM1 permettessero solo l'escaped html.
Così la cosa si complica.
Ma effettivamente ho letto anche XHTML e quindi come dici tu, mi ci ritroverò anche l'unicode.
C'è 1 maniera x aggiustare automaticamente tutti i caratteri (magari con una qualche funzioncina) senza mettermi io a fare tutta la casistica possibile e sostituire le stirnghe?! 
|
Giusto per capire ... tu devi scrivere o leggere un file RSS/ATOM?? E tramite quale linguaggio di programmazione?
Se devi leggere un file XML ti affiderai sicuramente ad un parser, che fa tutto lui per quanto riguarda l'interpretazione delle entità.
Se invece devi scrivere è comunque semplice. Innanzitutto devi stabilire il charset da usare. Non sei obbligato a codificare un carattere unicode come
“. Se, per esempio, dichiari un charset come UTF-8, basta che mandi in output la sequenza esatta per codificare questo carattere, cioè (in hex) E2 80 9C.
È la stessa identica cosa che succede anche in HTML/XHTML. Le entità le puoi sempre mettere in qualunque caso e indipendentemente da quale charset specifichi. Poi sei libero di scrivere nel file un qualunque carattere secondo il charset specificato.