Torna indietro   Hardware Upgrade Forum > Software > Programmazione

NVIDIA Blackwell B200: due chip in uno per rivoluzionare l'intelligenza artificiale
NVIDIA Blackwell B200: due chip in uno per rivoluzionare l'intelligenza artificiale
Due GPU (die) su un unico package per un totale di 208 miliardi di transistor: la nuova GPU Blackwell di NVIDIA nasce per accelerare l'innovazione nel campo dell'intelligenza artificiale come mai prima d'ora. La nuova proposta è accompagnata da 192 GB di memoria HBM3E per una bandwidth di 8 TB/s. A comporre la nuova offerta di NVIDIA troviamo tre soluzioni: B100, B200 e GB200.
HP Envy Move, un PC All-In-One con la batteria che si può spostare facilmente
HP Envy Move, un PC All-In-One con la batteria che si può spostare facilmente
HP Envy Move non è un PC all-in-one come tutti gli altri: si può spostare facilmente e usare lontano dalla presa di corrente. Lo schermo touch consente di usarlo anche come un grande tablet e può diventare un display aggiuntivo. Il tutto condito da un'attenzione all'ambiente grazie all'uso di materiali riciclati.
MSI MPG 321URX QD-OLED: un monitor completo per i giocatori
MSI MPG 321URX QD-OLED: un monitor completo per i giocatori
MSI MPG 321URX QD-OLED è un monitor completo, con diagonale da 32 pollici, risoluzione UHD, porte HDMI 2.1, frequenza di aggiornamento di 240 Hz e con un pannello OLED che offre diverse caratteristiche interessanti per il pubblico dei giocatori
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 03-04-2017, 21:13   #1
karrygun
Senior Member
 
L'Avatar di karrygun
 
Iscritto dal: Feb 2013
Messaggi: 978
codifica del testo

ho notato su internet che diversi siti hanno delle codifiche diverse. inoltre mi par di capire che sono pure cryptati.

inoltre può capitare che ogni tanto si va in certi siti e spuntano tante lettere strane.

vorrei capirne un po di piu e vorrei inoltre capire come poterle convertire in modo adeguato
karrygun è offline   Rispondi citando il messaggio o parte di esso
Old 12-04-2017, 12:31   #2
fano
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2095
La storia dell'encoding del testo è lunga praticamente: è un problema che esiste da quando esistono i computer (40 anni cioè!).

Tagliamo i primi 30 anni in cui i computer erano grossi come armadi e con HDD da 3 MB grossi come lavatrici e lasciamo riposare nella sua tomba il C=64 e gli altri Home Computer e parliamo solamente dei PC...

Quando IBM creò il Personal Computer lo fece "parlare" solo in Inglese e quindi prese la strada più semplice: associò ogni carattere ad un byte (le più piccola unità di dato rappresentabile in ASSEMBLER, i bit non sono "rappresentabili") e visto che 127 combinazioni bastavano ed avanzavano poteva usare 7 Bit con 1 bit Bit in "avanzo" che magari poteva essere usato come flag per chissà quali turpi scopi!
Questo codifica è oggi conosciuta come ASCII: http://www.asciitable.com.

Quando poi il PC fu portato in Europa non fummo affatto soddisfatti che un PC fiammante da 3'000 $ (costavano anche di più se si aggiorna al valore di oggi) manco si poteva scrivere il carattere 'è' e quindi IBM (e talvolta pure i clonatori) inventarono le codepages: l'idea era semplice usiamo gli altri 127 byte per rappresentare le altre lettere banale no?
Nasce CP437: https://en.wikipedia.org/wiki/Code_page_437.

Ci sono alcune lettere accentate dell'alfabeto latino esteso (ma NON tutte), strani caratteri "semi-grafici", ecc...

Bello vero? Il problema è risolto? Manco per nulla se sei per esempio greco! No il carattere che sembra "Beta" è l'Ess-Zed tedesco e poi ti mancherebbero un sacco di lettere quindi? Quindi usiamo di nuovi i 127 byte in più (gli stessi di prima ma con "significato" diverso) per le lettere greche: https://en.wikipedia.org/wiki/ISO/IEC_8859-7.

Ben presto ne nacquero centinaia di code page talvolta per lo stesso alfabeto, ma con sottili differenze (ma a volte lo stesso nome!), Apple e Commodore estesero ASCII in maniera totalmente incompatibile insomma un disastro!

Disastro totale sì perché dato uno stream di byte se non conosci l'encoding a priori i byte > 127 non sai cosa sono! Quindi? Quindi spesso ci si riduce a tirare ad indovinare!

XML / HTML e i formati "testuali" serii preverrebbero che la codepage sia indicata, ma per quanto riguarda XML / HTML il testo poi lo puoi scrivere anche in un altra encoding in ogni caso ed ecco appunto gli strani caratteri che vedi! Che non sono cifrati, ma sono chiamati "replacement characters" quando il "decoder" non sa che pesci pigliare ti mostra un quadratino con dentro dei numerini e via
L'altro problema è che per risparmiare spazio (i primi HDD avevano pochi MegaByte a disposizione se avevano un HDD alcuni PC usavano solo il floppy) o solo la tua code page o poche altre erano installate quindi alla fine rischiavi di vedere comunque "replacement characters" lo stesso!

La soluzione è stata in teoria trovata 15 anni fa (!) si chiama unicode... hanno dovuto farne 3 versioni perché alla prima non gli è venuto (a 32 bit, 16 bit che non supporta "inutili" ideogrammi cino-giapponesi se non con dei kludge e 8 bit che però occupa più spazio ed è un incubo da decodificare).

Questa è la mia opinione personale: ma il formato giusto è UFT-16 (infatti è usato da Windows e da MacOS) gli ideogrammi o alfabeto "giocattolo" tipo Tolkien o Klingon NON sono caratteri, ma immagini
UTF-8 è stato creato per retro-compatibilità con il C cercando "a forza" di rappresentarlo dentro il tipo 'char *' così ora si ha il doppio casino:

1. Le stringhe in C continuano a non esistere ed in più un for di ogni carattere nella stringa potrebbe mostrarti "mezzo" carattere
2. La funzione strlen() non torna la "vera" lunghezza della stringa

il risultato alla fine è che poi su Linux non riescono a decodificare nemmeno una semplice "è" e la sostituiscono con il replacement character, imbarazzante

Per convertine da un encoding all'altro in C potresti usare iconv, ma devi quasi sempre ricompilarti la libreria (!) visto che di default contiene solo ASCII, hanno anche fatto un bel pasticcio visto che l'hanno unita con la libc (che non c'entra ovviamente nulla), io l'ultima volta dovendo convertire da UTF-8 a CP864 https://en.wikipedia.org/wiki/Code_page_864 (alfabeto arabo) mi sono dovuto rassegnare a farmi una mia libreria, ma in C / Linux è cosa normale che le libreria "core" non funzionino a quanto pare

In C# è ovviamente integrato nelle classi basi e funziona pure ovviamente:
https://msdn.microsoft.com/en-us/lib...vs.110%29.aspx
__________________
Cosmos C# Open Source Managed Operating System
Cosmos Thread Ufficiale
Cosmos Official Site Vuoi collaborare allo sviluppo? Unisciti alla chat!

Ultima modifica di fano : 12-04-2017 alle 12:40.
fano è offline   Rispondi citando il messaggio o parte di esso
Old 12-04-2017, 19:56   #3
karrygun
Senior Member
 
L'Avatar di karrygun
 
Iscritto dal: Feb 2013
Messaggi: 978
e quindi mi par di capire che hanno fatto tanto lavoro di decodifica ma che ancora non è perfetto?

mi ritrovo alcuni siti in italiano con delle lettere strane e in siti stranieri (cliccati occasionalmente) con simboli tipo un quadrato bianco , un simbolo che sembra un immagine e dei diamanti col punto interrogativo.
karrygun è offline   Rispondi citando il messaggio o parte di esso
Old 13-04-2017, 10:19   #4
fano
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2095
Il problema è che molte cose nel nostro settore sono state fatte un po' alla membro di segugio, il mercato PC si è sviluppato quasi più per evoluzione / selezione naturale che per cose studiate a tavolino e quando ci hanno provato (tipo VBE) hanno fatto pure un gran casino

Unicode funzione ed anche perfettamente, ma se ancora oggi il terminale di Linux di fatto supporta solo caratteri ASCII (!) e Windows 10 invece di default ha la code page dell'Italiano solo perché il mio SO è in Italiano... non se ne esce!

Il vero problema (irrisolvibile!) è che dato un array di byte tipo questo (numeri a caso è):

Codice:
byte[] arr = { 0xFA, 0x80, 0x42,  0x69 }
come fai a sapere come decodificarlo? Se fai il "finto" UTF-8 di Linux (ASCII di fatto) solo 0x42 ('A') ha senso il resto cos'è? Magari invece era davvero UTF-8 e i primi tre byte erano la lettera 'è'? O era UFT-16 (quindi sono 2 caratteri!)? E se invece era una sola f*ttuta lettera nella code page del giapponese? Chi lo sa?

come ti ho detto se è HTML/XML o un .doc l'encoding c'è scritto (ma in HTML/XML poi ci sbatti dentro quello che vuoi: è solo un "hint"), ma se è un .txt o byte che leggi dal cavo e non sai a priori che codifica usare sei fritto!

A questo problema dell'encoding se ne aggiunge un altro quello dei font quelli gratuiti (quindi usabili in Open Source OS come Linux e Cosmos) spesso disegnano nemmeno 50 - 60 dei 4'000'000'000 di font che esistono
Per esempio:
https://fonts.google.com/specimen/Noto+Sans
__________________
Cosmos C# Open Source Managed Operating System
Cosmos Thread Ufficiale
Cosmos Official Site Vuoi collaborare allo sviluppo? Unisciti alla chat!

Ultima modifica di fano : 13-04-2017 alle 10:32.
fano è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2017, 19:26   #5
karrygun
Senior Member
 
L'Avatar di karrygun
 
Iscritto dal: Feb 2013
Messaggi: 978
nonostante tutte queste difficoltà , ho trovato siti con il utf-8 ma con strani simboli. ho provato a decifrarli e pare che abbia una seconda codifica (è possibile?) e le lettere sono asiatiche. va a capire di quale lingua...
karrygun è offline   Rispondi citando il messaggio o parte di esso
Old 20-04-2017, 10:17   #6
fano
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2095
Se sono cose tipo questa '' quelle che vedi è semplice forse riesci a decodificare l'UTF-8, ma poi i tuoi font non hanno modo per rappresentare il carattere! I numerini che vedi all'interno sono la codifica unicode del carattere...

Ma sei su Linux che hai tutti sti problemi? Su Windows / Mac OSX è molto raro avere sti casini con cose del genere...
__________________
Cosmos C# Open Source Managed Operating System
Cosmos Thread Ufficiale
Cosmos Official Site Vuoi collaborare allo sviluppo? Unisciti alla chat!
fano è offline   Rispondi citando il messaggio o parte di esso
Old 20-04-2017, 10:17   #7
pabloski
Senior Member
 
Iscritto dal: Jan 2008
Messaggi: 8406
Quote:
Originariamente inviato da karrygun Guarda i messaggi
nonostante tutte queste difficoltà , ho trovato siti con il utf-8 ma con strani simboli. ho provato a decifrarli e pare che abbia una seconda codifica (è possibile?) e le lettere sono asiatiche. va a capire di quale lingua...
No no fermo. UTF-8 supporta tutto il set di caratteri Unicode. Se escono i quadrati bianchi con i punti interrogativi, allora e' il font usato dal browser che non implementa i glifi per quei code point.
pabloski è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


NVIDIA Blackwell B200: due chip in uno per rivoluzionare l'intelligenza artificiale NVIDIA Blackwell B200: due chip in uno per rivol...
HP Envy Move, un PC All-In-One con la batteria che si può spostare facilmente HP Envy Move, un PC All-In-One con la batteria c...
MSI MPG 321URX QD-OLED: un monitor completo per i giocatori MSI MPG 321URX QD-OLED: un monitor completo per ...
realme 12 Pro+ 5G: un potente mid-range con teleobiettivo sotto i 400 euro. La recensione realme 12 Pro+ 5G: un potente mid-range con tele...
Fujifilm Simulazione Pellicola – Guida all'uso Fujifilm Simulazione Pellicola – Guida all'uso
Nothing annuncerà domani, 20 marz...
Galaxy Z Fold6, la versione economica po...
Tesla conferma: in Italia la Model Y RWD...
Sk hynix, tempismo perfetto: è pr...
Microsoft conferma un secondo evento a m...
Xiaomi 14 Ultra è disponibile in ...
Apple al lavoro per evitare commissioni ...
TSMC e Synopsys sono pronte ad accelerar...
Whistleblowing, obbligo e opportunit&agr...
Offerte di Primavera Amazon: da mezzanot...
Nothing Phone (2a) è ora lo smart...
Tutte le offerte Apple da non perdere or...
Tutte le offerte sui televisori Amazon: ...
Offerte Ring Intercom di Amazon: il cito...
ho.mobile passa con Vodafone a Swisscom:...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 12:10.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Served by www3v