Torna indietro   Hardware Upgrade Forum > Software > Programmazione

DJI Mic Mini 2: audio 48 kHz / 24-bit e protocollo OsmoAudio sotto i 100 Euro
DJI Mic Mini 2: audio 48 kHz / 24-bit e protocollo OsmoAudio sotto i 100 Euro
DJI presenta Mic Mini 2, un sistema microfonico wireless ultra-compatto progettato per democratizzare l'audio di alta qualità nella fascia entry-level. Con un peso di soli 11 grammi per il trasmettitore elimina i fastidi tipici dei modelli più pesanti sui vestiti. Nonostante la miniaturizzazione Mic Mini 2 offre prestazioni tecniche di rilievo: registrazione omnidirezionale a 48 kHz/24-bit, tre preset vocali (Regular, Bright, Rich) e un sistema di cancellazione attiva del rumore a due livelli.
Recensione Moto G77: display AMOLED e buona autonomia per il midrange economico
Recensione Moto G77: display AMOLED e buona autonomia per il midrange economico
Motorola propone in fascia media il nuovo Moto G77 5G, uno smartphone che punta sul display AMOLED da 1.5K a 120Hz, e sulla fotocamera da 108 MP con stabilizzazione ottica per affrontare la fascia media. Il tutto insieme a una batteria da 5200mAh in soli 7,3 millimetri di spessore, con una scocca certificata con standard militari
DJI Lito 1 e Lito X1 recensione: i nuovi droni per principianti che non si fanno mancare nulla
DJI Lito 1 e Lito X1 recensione: i nuovi droni per principianti che non si fanno mancare nulla
DJI ha appena ufficializzato la serie Lito, la sua nuova gamma di droni entry-level destinata a chi si avvicina per la prima volta alla fotografia aerea. Al centro dell'annuncio ci sono due modelli ben distinti per fascia di prezzo e specifiche tecniche: DJI Lito 1 e DJI Lito X1. Entrambi si collocano sotto la soglia regolamentare dei 249 grammi, che permette di volare con requisiti burocratici più semplici rispetto ai droni più pesanti.
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 03-04-2017, 20:13   #1
karrygun
Senior Member
 
L'Avatar di karrygun
 
Iscritto dal: Feb 2013
Messaggi: 978
codifica del testo

ho notato su internet che diversi siti hanno delle codifiche diverse. inoltre mi par di capire che sono pure cryptati.

inoltre può capitare che ogni tanto si va in certi siti e spuntano tante lettere strane.

vorrei capirne un po di piu e vorrei inoltre capire come poterle convertire in modo adeguato
karrygun è offline   Rispondi citando il messaggio o parte di esso
Old 12-04-2017, 11:31   #2
fano
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2095
La storia dell'encoding del testo è lunga praticamente: è un problema che esiste da quando esistono i computer (40 anni cioè!).

Tagliamo i primi 30 anni in cui i computer erano grossi come armadi e con HDD da 3 MB grossi come lavatrici e lasciamo riposare nella sua tomba il C=64 e gli altri Home Computer e parliamo solamente dei PC...

Quando IBM creò il Personal Computer lo fece "parlare" solo in Inglese e quindi prese la strada più semplice: associò ogni carattere ad un byte (le più piccola unità di dato rappresentabile in ASSEMBLER, i bit non sono "rappresentabili") e visto che 127 combinazioni bastavano ed avanzavano poteva usare 7 Bit con 1 bit Bit in "avanzo" che magari poteva essere usato come flag per chissà quali turpi scopi!
Questo codifica è oggi conosciuta come ASCII: http://www.asciitable.com.

Quando poi il PC fu portato in Europa non fummo affatto soddisfatti che un PC fiammante da 3'000 $ (costavano anche di più se si aggiorna al valore di oggi) manco si poteva scrivere il carattere 'è' e quindi IBM (e talvolta pure i clonatori) inventarono le codepages: l'idea era semplice usiamo gli altri 127 byte per rappresentare le altre lettere banale no?
Nasce CP437: https://en.wikipedia.org/wiki/Code_page_437.

Ci sono alcune lettere accentate dell'alfabeto latino esteso (ma NON tutte), strani caratteri "semi-grafici", ecc...

Bello vero? Il problema è risolto? Manco per nulla se sei per esempio greco! No il carattere che sembra "Beta" è l'Ess-Zed tedesco e poi ti mancherebbero un sacco di lettere quindi? Quindi usiamo di nuovi i 127 byte in più (gli stessi di prima ma con "significato" diverso) per le lettere greche: https://en.wikipedia.org/wiki/ISO/IEC_8859-7.

Ben presto ne nacquero centinaia di code page talvolta per lo stesso alfabeto, ma con sottili differenze (ma a volte lo stesso nome!), Apple e Commodore estesero ASCII in maniera totalmente incompatibile insomma un disastro!

Disastro totale sì perché dato uno stream di byte se non conosci l'encoding a priori i byte > 127 non sai cosa sono! Quindi? Quindi spesso ci si riduce a tirare ad indovinare!

XML / HTML e i formati "testuali" serii preverrebbero che la codepage sia indicata, ma per quanto riguarda XML / HTML il testo poi lo puoi scrivere anche in un altra encoding in ogni caso ed ecco appunto gli strani caratteri che vedi! Che non sono cifrati, ma sono chiamati "replacement characters" quando il "decoder" non sa che pesci pigliare ti mostra un quadratino con dentro dei numerini e via
L'altro problema è che per risparmiare spazio (i primi HDD avevano pochi MegaByte a disposizione se avevano un HDD alcuni PC usavano solo il floppy) o solo la tua code page o poche altre erano installate quindi alla fine rischiavi di vedere comunque "replacement characters" lo stesso!

La soluzione è stata in teoria trovata 15 anni fa (!) si chiama unicode... hanno dovuto farne 3 versioni perché alla prima non gli è venuto (a 32 bit, 16 bit che non supporta "inutili" ideogrammi cino-giapponesi se non con dei kludge e 8 bit che però occupa più spazio ed è un incubo da decodificare).

Questa è la mia opinione personale: ma il formato giusto è UFT-16 (infatti è usato da Windows e da MacOS) gli ideogrammi o alfabeto "giocattolo" tipo Tolkien o Klingon NON sono caratteri, ma immagini
UTF-8 è stato creato per retro-compatibilità con il C cercando "a forza" di rappresentarlo dentro il tipo 'char *' così ora si ha il doppio casino:

1. Le stringhe in C continuano a non esistere ed in più un for di ogni carattere nella stringa potrebbe mostrarti "mezzo" carattere
2. La funzione strlen() non torna la "vera" lunghezza della stringa

il risultato alla fine è che poi su Linux non riescono a decodificare nemmeno una semplice "è" e la sostituiscono con il replacement character, imbarazzante

Per convertine da un encoding all'altro in C potresti usare iconv, ma devi quasi sempre ricompilarti la libreria (!) visto che di default contiene solo ASCII, hanno anche fatto un bel pasticcio visto che l'hanno unita con la libc (che non c'entra ovviamente nulla), io l'ultima volta dovendo convertire da UTF-8 a CP864 https://en.wikipedia.org/wiki/Code_page_864 (alfabeto arabo) mi sono dovuto rassegnare a farmi una mia libreria, ma in C / Linux è cosa normale che le libreria "core" non funzionino a quanto pare

In C# è ovviamente integrato nelle classi basi e funziona pure ovviamente:
https://msdn.microsoft.com/en-us/lib...vs.110%29.aspx
__________________
Cosmos C# Open Source Managed Operating System
Cosmos Thread Ufficiale
Cosmos Official Site Vuoi collaborare allo sviluppo? Unisciti alla chat!

Ultima modifica di fano : 12-04-2017 alle 11:40.
fano è offline   Rispondi citando il messaggio o parte di esso
Old 12-04-2017, 18:56   #3
karrygun
Senior Member
 
L'Avatar di karrygun
 
Iscritto dal: Feb 2013
Messaggi: 978
e quindi mi par di capire che hanno fatto tanto lavoro di decodifica ma che ancora non è perfetto?

mi ritrovo alcuni siti in italiano con delle lettere strane e in siti stranieri (cliccati occasionalmente) con simboli tipo un quadrato bianco , un simbolo che sembra un immagine e dei diamanti col punto interrogativo.
karrygun è offline   Rispondi citando il messaggio o parte di esso
Old 13-04-2017, 09:19   #4
fano
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2095
Il problema è che molte cose nel nostro settore sono state fatte un po' alla membro di segugio, il mercato PC si è sviluppato quasi più per evoluzione / selezione naturale che per cose studiate a tavolino e quando ci hanno provato (tipo VBE) hanno fatto pure un gran casino

Unicode funzione ed anche perfettamente, ma se ancora oggi il terminale di Linux di fatto supporta solo caratteri ASCII (!) e Windows 10 invece di default ha la code page dell'Italiano solo perché il mio SO è in Italiano... non se ne esce!

Il vero problema (irrisolvibile!) è che dato un array di byte tipo questo (numeri a caso è):

Codice:
byte[] arr = { 0xFA, 0x80, 0x42,  0x69 }
come fai a sapere come decodificarlo? Se fai il "finto" UTF-8 di Linux (ASCII di fatto) solo 0x42 ('A') ha senso il resto cos'è? Magari invece era davvero UTF-8 e i primi tre byte erano la lettera 'è'? O era UFT-16 (quindi sono 2 caratteri!)? E se invece era una sola f*ttuta lettera nella code page del giapponese? Chi lo sa?

come ti ho detto se è HTML/XML o un .doc l'encoding c'è scritto (ma in HTML/XML poi ci sbatti dentro quello che vuoi: è solo un "hint"), ma se è un .txt o byte che leggi dal cavo e non sai a priori che codifica usare sei fritto!

A questo problema dell'encoding se ne aggiunge un altro quello dei font quelli gratuiti (quindi usabili in Open Source OS come Linux e Cosmos) spesso disegnano nemmeno 50 - 60 dei 4'000'000'000 di font che esistono
Per esempio:
https://fonts.google.com/specimen/Noto+Sans
__________________
Cosmos C# Open Source Managed Operating System
Cosmos Thread Ufficiale
Cosmos Official Site Vuoi collaborare allo sviluppo? Unisciti alla chat!

Ultima modifica di fano : 13-04-2017 alle 09:32.
fano è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2017, 18:26   #5
karrygun
Senior Member
 
L'Avatar di karrygun
 
Iscritto dal: Feb 2013
Messaggi: 978
nonostante tutte queste difficoltà , ho trovato siti con il utf-8 ma con strani simboli. ho provato a decifrarli e pare che abbia una seconda codifica (è possibile?) e le lettere sono asiatiche. va a capire di quale lingua...
karrygun è offline   Rispondi citando il messaggio o parte di esso
Old 20-04-2017, 09:17   #6
fano
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2095
Se sono cose tipo questa '' quelle che vedi è semplice forse riesci a decodificare l'UTF-8, ma poi i tuoi font non hanno modo per rappresentare il carattere! I numerini che vedi all'interno sono la codifica unicode del carattere...

Ma sei su Linux che hai tutti sti problemi? Su Windows / Mac OSX è molto raro avere sti casini con cose del genere...
__________________
Cosmos C# Open Source Managed Operating System
Cosmos Thread Ufficiale
Cosmos Official Site Vuoi collaborare allo sviluppo? Unisciti alla chat!
fano è offline   Rispondi citando il messaggio o parte di esso
Old 20-04-2017, 09:17   #7
pabloski
Senior Member
 
Iscritto dal: Jan 2008
Messaggi: 8406
Quote:
Originariamente inviato da karrygun Guarda i messaggi
nonostante tutte queste difficoltà , ho trovato siti con il utf-8 ma con strani simboli. ho provato a decifrarli e pare che abbia una seconda codifica (è possibile?) e le lettere sono asiatiche. va a capire di quale lingua...
No no fermo. UTF-8 supporta tutto il set di caratteri Unicode. Se escono i quadrati bianchi con i punti interrogativi, allora e' il font usato dal browser che non implementa i glifi per quei code point.
pabloski è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


DJI Mic Mini 2: audio 48 kHz / 24-bit e protocollo OsmoAudio sotto i 100 Euro DJI Mic Mini 2: audio 48 kHz / 24-bit e protocol...
Recensione Moto G77: display AMOLED e buona autonomia per il midrange economico Recensione Moto G77: display AMOLED e buona auto...
DJI Lito 1 e Lito X1 recensione: i nuovi droni per principianti che non si fanno mancare nulla DJI Lito 1 e Lito X1 recensione: i nuovi droni p...
Sony World Photography Awards 2026: i premiati, anche italiani, il punto sulla fotografia di oggi Sony World Photography Awards 2026: i premiati, ...
Una settimana con Hyundai Ioniq 5 N-Line: diverte e convince Una settimana con Hyundai Ioniq 5 N-Line: divert...
Quantinuum si appresta a debuttare in Bo...
Censis: il 60% degli italiani evita i me...
Cloud sovrano: Microsoft potenzia Azure ...
Spionaggio industriale: l'edge è ...
Cosa cambia davvero su un'auto elettrica...
Agenti AI più costosi dei dipende...
GeForce RTX 5070 Laptop da 12 GB al debu...
Le aziende e i prodotti candidati all'EH...
Il materiale che cambia tutto: funziona ...
Il cavo che 'salva' la tua GPU: Corsair ...
Lenovo, le mani sul BIOS per il controll...
DJI Osmo Action 4 a 189€: la action cam ...
MAN eTGX da 480 kWh diventa un power ban...
OpenAI ha speso troppo e non incassa qua...
G435 LIGHTSPEED a 35€ su Amazon: Logitec...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 16:28.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v