Unicode è la codifica più utilizzata sul Web

Sul Web il tasso d'adozione della codifica Unicode ha superato quello dello standard ASCII, parola di Google

di Fabio Gozzo pubblicata il 08 Maggio 2008, alle 11:45 nel canale Web
Google

I migliori sconti su Amazon oggi

Lenovo, Notebook Portatile, V15 G4 IRU, Display 15,6" Full HD, Intel Core i5-13420H, Ram 16 GB DDR4, 512 GB SSD NVMe, Win 11 Pro, Libre Office, Preconfigurato

419.00€ Compra ora

-46%

Echo Dot (Ultimo modello) | Altoparlante intelligente Wi-Fi e Bluetooth, suono più potente e dinamico, con Alexa | Blu notte

64.99 34.99€ Compra ora

-46%

CHEBIO Aspirapolvere Senza Fili, 45Kpa/550W/70 Mins Scopa Elettrica Senza Fili con Automatische Saugeinstellung e Display LED, Aspirapolvere con Anti-Avvolgimento per Pavimenti/Tappeti/Peli

108.99€ Compra ora

Nuovo Toshiba Portégé M800: 13,3 pollici bianco

4 alimentatori 80 Plus per GlacialTech

sonic_xp08 Maggio 2008, 17:51 #11

ehm, una cosa è l'unicode, un'altra l'UTF-8 o l'UTF-16, che sono due modalità diverse per memorizzare l'unicode:
il primo si comporta come dice II Arrows, il secondo è alla casua del raddoppio del file quando salvi in "unicode".

Il che è coerente con quanto scritto nell'articolo...

LZar08 Maggio 2008, 18:35 #12

Originariamente inviato da: sonic_xp

Ah, ecco, mi pareva! Grazie della puntualizzazione. Mi sembrava di ricordare che UTF-16 usasse sempre una parola di 16 bit come unità minima ma l'affermazione di II Arrows mi ha mandato in confusione.

Ma quindi che vantaggio c'è ad usare UTF-16 rispetto ad UTF-8? Il secondo non dovrebbe essere sempre più efficiente? O ci sono caratteri per cui UTF-16 usa una singola parola mentre UTF-8 richiede 3 o 4 bytes?

share_it08 Maggio 2008, 18:38 #13

se solo windows si decidesse a usare utf di default

peppepz08 Maggio 2008, 22:19 #14

Io sono la persona più convinta del mondo che Microsoft sia il male - ma non addossiamogli colpe che non ha :-) . Non è vero che windows non usa l'unicode: proprio Windows NT ha scelto coraggiosamente (nei primi anni novanta!) di utilizzare l'unicode al posto dell'"ascii", in tutte le sue chiamate di sistema. Se ancora ci troviamo ad avere problemi con molti applicativi, è colpa dei programmatori "pigri", che tardano ad adattare il proprio codice, o che magari preferiscono mantenere la compatibilità con Windows 9x...

Bearpower08 Maggio 2008, 22:58 #15

Windows, Symbian e Apple utilizzano una rappresentazione di un singolo simbolo che non è conforme allo standar che definisce il "wide char" (wchar_t) che dice che un singolo simbolo deve poter essere rappresentato da un singolo wchar_t.

Questi sistemi definiscono il "simbolo" internamente come 16 bit, rendendo di fatto impossibile rappresentare qualcosa che sta al di fuori della BMP (basic multilingual plane, ovvero tutte le rappresentazioni contenute all'interno dei 16 bit) con un singolo simbolo.

Questo viene fatto proprio perchè le lingue contenute nella BMP sono generalmente più che sufficienti a fare una localizzazione, e si ha contemporaneamente il vantaggio di rappresentare un carattere con una lunghezza fissa. Questo tipo di codifica tuttavia, non è UTF-16, ma UCS-2.

Il tutto nel mondo reale andrebbe anche bene, se non fosse che nella parte alta di unicode (dopo i famosi 16 bit), detta SMP vengono rappresentati simboli non fonetici delle lingue moderni, per lo più kanji che quindi con UCS-2 non si possono rappresentare.

In un modo o nell'altro si rompe la conformità con uno dei due standard.

La soluzione sarebbe quella di adottare una rappresentazione a 32 bit (UTF-32/UCS-4), cosa che unix, se la memoria non mi tradisce, fa.

zephyr8308 Maggio 2008, 22:58 #16

Originariamente inviato da: peppepz

xp per i file NON usa l'unicode ma un proprio standard windows-qualcosa

Bearpower08 Maggio 2008, 23:08 #17

Originariamente inviato da: zephyr83

xp per i file NON usa l'unicode ma un proprio standard windows-qualcosa

XP internamente supporta UTF-16 fino alla BMP, poi ha degli stratagemmi per supportare la SMP.

Sono i programmatori pigri che non scomodano le funzioni che supportano le wide string e i wide char, ma utilizzano char a 8 bit.

zephyr8308 Maggio 2008, 23:47 #18

Originariamente inviato da: Bearpower

scusa ma per il nome dei file che colpa ne hanno i programmatori (se non quelli microsoft)? ogni volta che sn su linux i nomi dei file cn lettere accentate sn tutti strani

Bearpower09 Maggio 2008, 00:15 #19

Probabilmente su linux non stai usando unicode, ma una codepage.

zephyr8309 Maggio 2008, 00:37 #20

Originariamente inviato da: Bearpower

Probabilmente su linux non stai usando unicode, ma una codepage.

nn mi pare....cmq sapevo che windows come codifica dei caratteri usava Windows-1252.....verificherò...

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Sharkoon VK4 ARGB

Nintendo Switch 2

Fujifilm X-E5 con Fujinon XF23mm F2.8: una X100VI ma con ottica intercambiabile

2025 Nikon Comedy Wildlife Awards: i primi scatti del concorso

Nintendo Switch 2

MSI Prestige 13 AI e i portatili business al Computex

Lenovo IdeaPad Slim 3: un notebook Snapdragon X economico Forte della piattaforma Qualcomm Snapdragon X, il notebook Lenovo IdeaPad Slim 3 riesce a coniugare caratteristiche tecniche interessanti ad uno chassis robusto,...

Recensione OnePlus Watch 3 43mm: lo smartwatch che mancava per i polsi più piccoli OnePlus risponde alle esigenze di chi cerca un dispositivo indossabile dalle dimensioni contenute con OnePlus Watch 3 43mm. La versione ridotta del flagship mantiene...

The Edge of Fate è Destiny 2.5. E questo è un problema Bungie riesce a costruire una delle campagne più coinvolgenti della serie e introduce cambiamenti profondi al sistema di gioco, tra nuove stat e tier dell’equipaggiamento....

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...

Unicode è la codifica più utilizzata sul Web

Lenovo, Notebook Portatile, V15 G4 IRU, Display 15,6" Full HD, Intel Core i5-13420H, Ram 16 GB DDR4, 512 GB SSD NVMe, Win 11 Pro, Libre Office, Preconfigurato

Echo Dot (Ultimo modello) | Altoparlante intelligente Wi-Fi e Bluetooth, suono più potente e dinamico, con Alexa | Blu notte

CHEBIO Aspirapolvere Senza Fili, 45Kpa/550W/70 Mins Scopa Elettrica Senza Fili con Automatische Saugeinstellung e Display LED, Aspirapolvere con Anti-Avvolgimento per Pavimenti/Tappeti/Peli

24 Commenti