Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Polestar 3 Performance, test drive: comodità e potenza possono convivere
Polestar 3 Performance, test drive: comodità e potenza possono convivere
Abbiamo passato diversi giorni alla guida di Polestar 3, usata in tutti i contesti. Come auto di tutti i giorni è comodissima, ma se si libera tutta la potenza è stupefacente
Qualcomm Snapdragon X2 Elite: l'architettura del SoC per i notebook del 2026
Qualcomm Snapdragon X2 Elite: l'architettura del SoC per i notebook del 2026
In occasione del proprio Architecture Deep Dive 2025 Qualcomm ha mostrato in dettaglio l'architettura della propria prossima generazione di SoC destinati ai notebook Windows for ARM di prossima generazione. Snapdragon X2 Elite si candida, con sistemi in commercio nella prima metà del 2026, a portare nuove soluzioni nel mondo dei notebook sottili con grande autonomia
Recensione DJI Mini 5 Pro: il drone C0 ultra-leggero con sensore da 1 pollice
Recensione DJI Mini 5 Pro: il drone C0 ultra-leggero con sensore da 1 pollice
DJI Mini 5 Pro porta nella serie Mini il primo sensore CMOS da 1 pollice, unendo qualità d'immagine professionale alla portabilità estrema tipica di tutti i prodotti della famiglia. È un drone C0, quindi in un peso estremamente contenuto e che non richiede patentino, propone un gimbal rotabile a 225 gradi, rilevamento ostacoli anche notturno e autonomia fino a 36 minuti. Caratteristiche che rendono il nuovo drone un riferimento per creator e appassionati
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 04-01-2010, 18:32   #1
rayman2
Senior Member
 
Iscritto dal: Jan 2002
Messaggi: 437
[Java] Caratteri UTF8

Ciao a tutti. Vado dritto al sodo e vi espongo il mio problema.
Devo manipolare un file di testo che contiene, invece dei caratteri della tastiera italiana 'è', 'à', ... degli altri caratteri speciali tipo 'è', 'Ã'...
C'è qualche modo per tradurre qualcosa tipo 'è' in 'è', 'Ã' in 'à' e così via?
rayman2 è offline   Rispondi citando il messaggio o parte di esso
Old 04-01-2010, 20:05   #2
fero86
Senior Member
 
Iscritto dal: Oct 2006
Città: Roma
Messaggi: 1383
tradurre secondo quale schema? cioé, quale carattere deve diventare à, quale deve diventare è, e via dicendo?
fero86 è offline   Rispondi citando il messaggio o parte di esso
Old 04-01-2010, 21:27   #3
rayman2
Senior Member
 
Iscritto dal: Jan 2002
Messaggi: 437
Dunque, provo a spiegarmi meglio. Non è che qualcuno mi ha fatto uno scherzo sostituendo caratteri a caso, si tratta di un software per salvare i messaggi per il cellulare in file di testo, che funziona a meno dell'errore dei caratteri accentati.

Se apro il file esportato da questo software, al posto dei caratteri accentati mi compaiono altri caratteri (non a casaccio, ma non so dire con quale codifica esatta). Un esempio è appunto quello del primo post.

Il mio programma vuole leggere questo file di testo e stampare in una pagina html il contenuto dei messaggi.

La cosa strana è che se stampo il testo di un messaggio con una System.out.println() gli accenti vengono gestiti in modo corretto.
Se invece stampo con un buffered writer su file, questi vengono scritti come sul file di testo originale (cioè sbagliati) e di conseguenza la mia pagina html ha le lettere con accento sbagliate.
rayman2 è offline   Rispondi citando il messaggio o parte di esso
Old 04-01-2010, 22:28   #4
wizard1993
Senior Member
 
L'Avatar di wizard1993
 
Iscritto dal: Apr 2006
Messaggi: 22462
ma hai controllato che il tuo browser non parta usi di default un charset che non sia l'utf?
__________________
amd a64x2 4400+ sk939;asus a8n-sli; 2x1gb ddr400; x850 crossfire; 2 x western digital abys 320gb|| asus g1
Se striscia fulmina, se svolazza l'ammazza
wizard1993 è offline   Rispondi citando il messaggio o parte di esso
Old 04-01-2010, 22:50   #5
rayman2
Senior Member
 
Iscritto dal: Jan 2002
Messaggi: 437
In effetti avevi ragione...non avevo specificato nel sorgente html che si trattava di un file con codifica utf8

Codice:
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xml:lang="it" lang="it" xmlns="http://www.w3.org/1999/xhtml">
rayman2 è offline   Rispondi citando il messaggio o parte di esso
Old 04-01-2010, 23:04   #6
fero86
Senior Member
 
Iscritto dal: Oct 2006
Città: Roma
Messaggi: 1383
Quote:
Originariamente inviato da rayman2 Guarda i messaggi
[...] Se invece stampo con un buffered writer su file, questi vengono scritti come sul file di testo originale (cioè sbagliati)
non é che vengono scritti sbagliati, é che probabilmente quel file di testo lo apri con Blocco Note il quale non trova il BOM (Byte Order Mark) all'inizio visto che non ce l'hai messo* e quindi non capisce che la codifica é UTF8. prova ad aprirlo con un editor di testo nel quale sia possibile impostare la decodifica (prova con Notepad2 o Notepad++).

* non ce l'hai messo perché il BOM é uno standard Microsoft; é uno standard piu che sensato ma a quanto pare il resto del mondo non l'ha accettato e quindi il resto del mondo continua ottusamente a confondere i files ASCII, ANSI, Unicode e UTF8. Java fa parte del resto del mondo e quindi i FileWriter di Java non mettono Byte Order Marks.


Quote:
e di conseguenza la mia pagina html ha le lettere con accento sbagliate.
2 osservazioni:

1) HTML? nell'HTML i caratteri accentati non si scrivono direttamente, si usano le entities predefinite: "&agrave;", "&egrave;", ecc.

2) scrivi la pagina in XHTML, non HTML, cosi puoi iniziarla con la seguente linea di codice che specifica anche la codifica:
Codice:
<?xml version="1.0" encoding="UTF-8"?>
fero86 è offline   Rispondi citando il messaggio o parte di esso
Old 05-01-2010, 22:02   #7
Mixmar
Senior Member
 
L'Avatar di Mixmar
 
Iscritto dal: Feb 2002
Città: Trento
Messaggi: 962
Aggiungo che forse, se il tuo problema è quello di decodificare / codificare i caratteri in base alla codifica, e qualora tu conosca la codifica utilizzata dal tuo sistema per i dati, puoi utilizzare CharsetDecoder per convertire l'input in UTF-16 e CharsetEncoder per il contrario.
__________________
"Et Eärallo Endorenna utúlien. Sinome maruvan ar Hildinyar tenn' Ambar-metta!" -- Aragorn Elessar, Heir of Isildur
Mixmar -- OpenSuSE 11.1 on AMD 64 3000+ on DFI LanParty nF4-D | GeForce 6600 GT + Thermaltake Schooner on Samsung 710N
Storage -- ( 2 x Hitachi Deskstar 80 Gb + 1 x Hitachi 250 Gb ) = 1 RAID 5 + 1 Storage space LaCie Ethernet Disk Mini 250 Gb | HP - DV2150 EL MILAN CLAN
Mixmar è offline   Rispondi citando il messaggio o parte di esso
Old 05-01-2010, 22:11   #8
||ElChE||88
Senior Member
 
Iscritto dal: Dec 2003
Messaggi: 4907
Quote:
Originariamente inviato da fero86 Guarda i messaggi
* non ce l'hai messo perché il BOM é uno standard Microsoft; é uno standard piu che sensato ma a quanto pare il resto del mondo non l'ha accettato e quindi il resto del mondo continua ottusamente a confondere i files ASCII, ANSI, Unicode e UTF8. Java fa parte del resto del mondo e quindi i FileWriter di Java non mettono Byte Order Marks.
Il BOM UTF8 non è uno standard Microsoft, fa parte dallo standard Unicode (Capitolo 2.6).
||ElChE||88 è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Polestar 3 Performance, test drive: comodità e potenza possono convivere Polestar 3 Performance, test drive: comodit&agra...
Qualcomm Snapdragon X2 Elite: l'architettura del SoC per i notebook del 2026 Qualcomm Snapdragon X2 Elite: l'architettura del...
Recensione DJI Mini 5 Pro: il drone C0 ultra-leggero con sensore da 1 pollice Recensione DJI Mini 5 Pro: il drone C0 ultra-leg...
ASUS Expertbook PM3: il notebook robusto per le aziende ASUS Expertbook PM3: il notebook robusto per le ...
Test ride con Gowow Ori: elettrico e off-road vanno incredibilmente d'accordo Test ride con Gowow Ori: elettrico e off-road va...
Kingston Technology: memorie e storage c...
Narwal Freo Z10 Ultra: il robot con moci...
In 3 minuti le vedete tutte: sono le mig...
Black Friday da record per Tineco: le sc...
La nuova PS5 con Fortnite manda in tilt ...
Amazon, i tagli hanno colpito soprattutt...
Pazzesco: Panasonic Lumix DC-GH5M2E a 79...
Ecco tutte le offerte Black Friday pi&ug...
DJI Neo a 169€, Flip Combo a 309€ e molt...
Quattro persone arrestate negli USA per ...
Kindle Paperwhite Signature Edition, Col...
Boom di vendite per Kindle e Fire TV Sti...
iPhone 17 Pro, il più desiderato,...
Nuovo record, 849€ per i MacBook Air con...
Wi-Fi 8 secondo Intel: la nuova era del ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 12:59.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v