Unicode è la codifica più utilizzata sul Web

Sul Web il tasso d'adozione della codifica Unicode ha superato quello dello standard ASCII, parola di Google

di Fabio Gozzo pubblicata il 08 Maggio 2008, alle 11:45 nel canale Web
Google

Mark Davis, senior international software architect di Google, è di recente intervenuto sul blog ufficiale della compagnia di Mountain View con alcune interessanti considerazioni sugli standard di codifica dei caratteri attualmente utilizzati sul Web.

Basandosi su informazioni interne della compagnia, Davis afferma che attualmente lo standard più popolare per la codifica dei caratteri delle pagine Web non è più l'ASCII (American Standard Code for Information Interchange) ma l'Unicode.

Fonte: Google

In accordo con i dati rilasciati da Google, il sorpasso della codifica Unicode è avvenuto lo scorso dicembre e, nonostante il vantaggio sia tuttora minimo, è frutto di una crescita significativa è costante avvenuta nell'arco degli ultimi 3 anni.

La lenta ma graduale migrazione verso Unicode è in atto ormai da molto tempo e non è certo una sorpresa. Il sistema di codifica ASCII esteso utilizza 8 bit di memoria per memorizzare un singolo carattere ed è in grado di rappresentare solamente 256 simboli. Questa limitazione del formato ha portato alla nascita di diverse versioni dello standard al fine di soddisfare le diverse esigenze dei ceppi linguistici esistenti.

Per far fronte alla frammentazione e ai problemi di conversione dovuti all'esistenza di differenti versioni dello standard ASCII, è nato Unicode, un formato che si prefigge di poter rappresentare tutti i caratteri esistenti. Questo sistema di codifica è stato infatti pensato per poter essere facilmente espanso ed aggiornato, garantendo sempre la retrocompatibilità con le precedenti versioni. Attualmente sono utilizzate le codifiche a 8, 16 o 32 bit, indicate rispettivamente con le sigle UTF-8, UTF-16 e UTF-32.

La convergenza del Web verso il più recente standard di codifica Unicode riduce notevolmente le problematiche legate alla visualizzazione di differenti alfabeti, tuttavia ha come svantaggio una maggiore occupazione di memoria rispetto allo standard ASCII per la memorizzazione di un singolo carattere.

I migliori sconti su Amazon oggi

origimagic C4 Mini PC,con Ryzen 5 3550H Processor(fino a 3,7GHz) Light Gaming PC,16GB RAM,512GB SSD,Supporto Triple Display,USB3.2/Doppia Ethernet/Wi-Fi5/BT 5.0,Mini Desktop per Ufficio Domestico

229.00€ Compra ora

-38%

FRITZ!Repeater 1200 AX Edition International, Ripetitore - Wi-Fi 6 extender Dual Band con 2.400 Mbit/s (5 GHz) & 600 Mbit/s (2,4 GHz), Mesh, Access Point, 1x Gigabit LAN, Interfaccia in italiano

95.99 59.99€ Compra ora

-38%

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

29.99€ Compra ora

Nuovo Toshiba Portégé M800: 13,3 pollici bianco

4 alimentatori 80 Plus per GlacialTech

gian2139108 Maggio 2008, 12:00 #1

ma bensì

Aryan08 Maggio 2008, 12:03 #2

Che strano! Pensavo utilizzassero il 437 o l'850...

Così poi servivano 20 versione del sito...

ekerazha08 Maggio 2008, 12:17 #3

Il sito di hwupgrade.it usa "ancora" iso-8859-1

Pentema08 Maggio 2008, 12:27 #4

Sono molto interessanti questi dati, e molto significativo è il fatto che solo una compagnia come Google può analizzarli e farne statistiche precise su vasta scala.

MiKeLezZ08 Maggio 2008, 12:45 #5

allora w unicode
quando è che ci passa anche hwupgrade?

II ARROWS08 Maggio 2008, 13:17 #6

Ma direi anche normale... L'ascii va bene solo in USA che non hanno niente. E parliamo solo di testo, niente simboli matematici.

Tutte le altre lingue hanno gli accenti, e lettere "strane" per non parlare delle lingue con scrittura diversa dai caratteri romani...
Per me sono pochi i siti che usano Unicode...

II ARROWS08 Maggio 2008, 13:27 #7

Una cosa: chi ha scritto l'articolo sa come funziona la codifica UTF??

Occupa più byte solo quando si passa dal 128° carattere in poi, prima occupa 1B. In base al valore dei bit più significativi si sa quanti byte formano il prossimo carattere.
Se usiamo solo caratteri presenti in ASCII standard la dimensione del testo sarà identica. Se usiamo solo caratteri NON presenti sarà almeno il doppio.

Non è uno svantaggio la dimensione dei caratteri perchè non c'è altro modo per rappresentare i caratteri se non aumentando la quantità di bit necessari per descriverli. Il vantaggio è invece l'eliminazione dei byte non necessari alla rappresentazione.
UTF-32 contiene caratteri lunghi 8, 16, 24 E 32bit.

Motosauro08 Maggio 2008, 14:10 #8

Originariamente inviato da: II ARROWS

*
UTF Rulezz

LZar08 Maggio 2008, 15:41 #9

Originariamente inviato da: II ARROWS

Interessante. Visto che sembri ferrato in materia, ti faccio una domanda: apro un documento di testo in formato ANSI con Notepad (sono su una macchina con Windows XP), lo salvo in Unicode e la dimensione del file raddoppia. Il file contiene solo caratteri ASCII standard (ho fatto una prova scrivendo una serie di aaaaaaaaaaaaaa bbbbbbbbbbbbb cccccccccccc copiata ed incollata n volte per renderlo un po' corposo). Colpa di come Notepad / Windows gestiscono Unicode o dipende da qualcos'altro?

zephyr8308 Maggio 2008, 15:47 #10

sbaglio o windows usa un sistema di codifica tutto suo??

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Formula E Gen4 - La monoposto

Honda WN7, la prima moto elettrica dal vivo

Nikon Comedy Wildlife 2025: i finalisti del concorso

Qualcomm Snapdragon X2 Elite: l'architettura del SoC per i notebook del 2026 In occasione del proprio Architecture Deep Dive 2025 Qualcomm ha mostrato in dettaglio l'architettura della propria prossima generazione di SoC destinati ai notebook...

Recensione OnePlus 15: potenza da vendere e batteria enorme dentro un nuovo design OnePlus 15 nasce per alzare l'asticella delle prestazioni e del gaming mobile. Ma non solo, visto che integra un display LTPO 1,5K a 165 Hz, OxygenOS 16 con funzioni...

Recensione Borderlands 4, tra divertimento e problemi tecnici Gearbox Software rilancia la saga con Borderlands 4, ora disponibile su PS5, Xbox Series X|S e PC. Tra le novità spiccano nuove abilità di movimento, un pianeta...

DJI Osmo Nano: la piccola fotocamera alla prova sul campo La nuova fotocamera compatta DJI spicca per l'abbinamento ideale tra le dimensioni ridotte e la qualità d'immagine. Può essere installata in punti di ripresa difficilmente...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare Realizzato da Lenovo e installato presso il Cineca di Casalecchio di Reno, Pitagora offre circa 44 PFlop/s di potenza di calcolo ed è dedicato alla simulazione della...

Polestar 3 Performance, test drive: comodità e potenza possono convivere Abbiamo passato diversi giorni alla guida di Polestar 3, usata in tutti i contesti. Come auto di tutti i giorni è comodissima, ma se si libera tutta la potenza è...

Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA Rullo di lavaggio dei pavimenti abbinato a un potente motore da 28.000 Pa e a bracci esterni che si estendono: queste, e molte altre, le caratteristiche tecniche...

Unicode è la codifica più utilizzata sul Web

origimagic C4 Mini PC,con Ryzen 5 3550H Processor(fino a 3,7GHz) Light Gaming PC,16GB RAM,512GB SSD,Supporto Triple Display,USB3.2/Doppia Ethernet/Wi-Fi5/BT 5.0,Mini Desktop per Ufficio Domestico

FRITZ!Repeater 1200 AX Edition International, Ripetitore - Wi-Fi 6 extender Dual Band con 2.400 Mbit/s (5 GHz) & 600 Mbit/s (2,4 GHz), Mesh, Access Point, 1x Gigabit LAN, Interfaccia in italiano

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

24 Commenti