Torna indietro   Hardware Upgrade Forum > Software > Programmazione

iPhone 17 Pro: più di uno smartphone. È uno studio di produzione in formato tascabile
iPhone 17 Pro: più di uno smartphone. È uno studio di produzione in formato tascabile
C'è tanta sostanza nel nuovo smartphone della Mela dedicato ai creator digitali. Nuovo telaio in alluminio, sistema di raffreddamento vapor chamber e tre fotocamere da 48 megapixel: non è un semplice smartphone, ma uno studio di produzione digitale on-the-go
Intel Panther Lake: i processori per i notebook del 2026
Intel Panther Lake: i processori per i notebook del 2026
Panther Lake è il nome in codice della prossima generazione di processori Intel Core Ultra, che vedremo al debutto da inizio 2026 nei notebook e nei sistemi desktop più compatti. Nuovi core, nuove GPU e soprattutto una struttura a tile che vede per la prima volta l'utilizzo della tecnologia produttiva Intel 18A: tanta potenza in più, ma senza perdere in efficienza
Intel Xeon 6+: è tempo di Clearwater Forest
Intel Xeon 6+: è tempo di Clearwater Forest
Intel ha annunciato la prossima generazione di processori Xeon dotati di E-Core, quelli per la massima efficienza energetica e densità di elaborazione. Grazie al processo produttivo Intel 18A, i core passano a un massimo di 288 per ogni socket, con aumento della potenza di calcolo e dell'efficienza complessiva.
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 07-02-2006, 12:26   #1
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
[PHP e SAX] Problema parsing

Sto sviluppando un guestbook in php che utilizza sax per parsare i dati memorizzati.
Ho notato che se all'interno dei file xml utilizzo caratteri accentati come à è ì ò ù, oppure £ e alcuni altri, mi restituisce "XML ERROR: Invalid character at line ..."
Come mai? come faccio a utilizzare questo tipo di caratteri?

Inoltre quando apro uno di questi file XML, se faccio una fread(), questa si blocca appena incontra un carattere "<".
E' un po' limitativo visto che devo leggere un file XML, che è pieno di questi caratteri..

C'è una soluzione?

Grazie
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 13:07   #2
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
Sto sviluppando un guestbook in php che utilizza sax per parsare i dati memorizzati.
Ho notato che se all'interno dei file xml utilizzo caratteri accentati come à è ì ò ù, oppure £ e alcuni altri, mi restituisce "XML ERROR: Invalid character at line ..."
Come mai? come faccio a utilizzare questo tipo di caratteri?
Cosa hai messo nella dichiarazione dell'XML?? Se metti ad esempio:
Codice:
<?xml version="1.0" encoding="ISO-8859-1"?>
non dovresti avere problemi.

Quote:
Originariamente inviato da DoubleAJ
Inoltre quando apro uno di questi file XML, se faccio una fread(), questa si blocca appena incontra un carattere "<".
E' un po' limitativo visto che devo leggere un file XML, che è pieno di questi caratteri..
Il codice per leggere (tramite parser) un file XML in PHP tipicamente è simile a questo:
Codice:
$xml_parser = xml_parser_create ();

...imposta altre opzioni del parser...

$handle = @fopen ("nome_file.xml", "r");

if ($handle !== FALSE)
{
    while ($data = fread ($handle, 4096))
        if (!xml_parse ($xml_parser, $data, feof ($handle)))
            die ("XML error");

    fclose ($handle);
}

xml_parser_free ($xml_parser);
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 13:28   #3
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
L'errore era causato dal fatto che avevo tralasciato questa parte di dichiarazione: encoding="ISO-8859-1"
Però ora al posto dell'errore mi visualizza i caratteri sbagliati:
per esempio se sul file scrivo: à è ì ò ù £ %
il parser mi legge: à è ì ò ù £ %
Forse c'è un altro tipo di encoding...

Passando all'altro argomento, il problema è qui:
$data = fread ($handle, 4096))
La fread() e anche la fgets(), se nel file è presente il carattere < , dentro $data inseriscono il contenuto del file fino alla prima occorrenza di < , dopodichè termina come se quel carattere lo riconoscesse come end of file.
Se per esempio nel file ho scritto: "ciao com<e stai"
dentro $data mi ritroverò questo "ciao com"

La cosa strana è che se uso file_get_contents() questo non succede...
Il fatto è che non volevo leggere sempre tutto il file, perchè col passare del tempo i messaggi diventano diverse migliaia, e parsare un file enorme ogni volta che si chiama una pagina diventa costoso, soprattutto in termini di tempo penso..

Ultima modifica di DoubleAJ : 07-02-2006 alle 13:32.
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 14:08   #4
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
L'errore era causato dal fatto che avevo tralasciato questa parte di dichiarazione: encoding="ISO-8859-1"
Però ora al posto dell'errore mi visualizza i caratteri sbagliati:
per esempio se sul file scrivo: à è ì ò ù £ %
il parser mi legge: à è ì ò ù £ %
Uhm ..... a naso questi caratteri sanno di codifica UTF-8! Cioè mi sembra la codifica UTF-8 su 2 byte 110xxxxx 10xxxxxx.
Ma, tanto per sapere, la pagina HTML che crei quale charset ha??

Quote:
Originariamente inviato da DoubleAJ
Passando all'altro argomento, il problema è qui:
$data = fread ($handle, 4096))
La fread() e anche la fgets(), se nel file è presente il carattere < , dentro $data inseriscono il contenuto del file fino alla prima occorrenza di < , dopodichè termina come se quel carattere lo riconoscesse come end of file.
Se per esempio nel file ho scritto: "ciao com<e stai"
dentro $data mi ritroverò questo "ciao com"
Ti posso garantire (e non solo io) che la fread legge esattamente gli N caratteri richiesti (l'ultimo blocco letto dal file può essere più piccolo, questo è ovvio).
Come fai a dire che in $data ti ritrovi solo "ciao com"??? Hai fatto un echo $data; sulla pagina HTML??? Se così, certo che non ti trovi i <. Perché vengono visti come dei tag.
Comunque a te non dovrebbe interessare il blocco in $data. È la funzione xml_parse che si occupa di analizzare i dati e chiamare man mano le funzioni di callback definite!
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 14:31   #5
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
Perfetto! Bisognava cambiare il charset della pagina html da iso-8859-1 a UTF-8...
Ora tenendo il file xml in ISO-8859-1 e la pagina html a UTF-8 mi visualizza bene..

Grazie!

Ora guardo bene anche per il problema della fread()...
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 15:09   #6
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
Perfetto! Bisognava cambiare il charset della pagina html da iso-8859-1 a UTF-8...
Ora tenendo il file xml in ISO-8859-1 e la pagina html a UTF-8 mi visualizza bene..
Scusa, ma se prima nella tua pagina web vedevi i caratteri strani à è ì ò ù £ %, vuol dire che il file XML lo avevi (e penso lo hai tuttora) in UTF-8 e la pagina web la avevi in ISO-8859-1, dico bene?
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 15:28   #7
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
Quando vedevo male i caratteri avevo sia la pagina html che il file xml in iso-8859-1.
Ora, cambiando solo la pagina html in UTF-8 vedo tutto bene...
Non chiedermi perchè, in effetti non ha molto senso...
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 15:46   #8
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
Quando vedevo male i caratteri avevo sia la pagina html che il file xml in iso-8859-1.
Ora, cambiando solo la pagina html in UTF-8 vedo tutto bene...
Non chiedermi perchè, in effetti non ha molto senso...
Ah ... ecco, qualcosa non mi quadrava!
Vuol dire, molto probabilmente, che nonostante tu abbia specificato il charset iso-8859-1 nel file xml (nella prima riga), hai dentro il file dei caratteri codificati come UTF-8.
Non so come hai fatto il file xml, cioè con quale tool o editor.
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 15:53   #9
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
...wordpad...
Però nel salvataggio ho lasciato la codifica ansi.
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 16:21   #10
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
...wordpad...
Però nel salvataggio ho lasciato la codifica ansi.
Uh ... molto strano!
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


iPhone 17 Pro: più di uno smartphone. È uno studio di produzione in formato tascabile iPhone 17 Pro: più di uno smartphone. &Eg...
Intel Panther Lake: i processori per i notebook del 2026 Intel Panther Lake: i processori per i notebook ...
Intel Xeon 6+: è tempo di Clearwater Forest Intel Xeon 6+: è tempo di Clearwater Fore...
4K a 160Hz o Full HD a 320Hz? Titan Army P2712V, a un prezzo molto basso 4K a 160Hz o Full HD a 320Hz? Titan Army P2712V,...
Recensione Google Pixel Watch 4: basta sollevarlo e si ha Gemini sempre al polso Recensione Google Pixel Watch 4: basta sollevarl...
MindsEye, rivolta dei dipendenti contro ...
In Cina Xiaomi SU7 Ultra prende fuoco do...
Apple Smart Glass: display integrato e d...
Mortal Kombat 3 si farà: la confe...
iPhone 18 Pro: prime indiscrezioni sulle...
Vai all'università? Hai un anno d...
Rubrik accelera su IA e sicurezza: tra c...
Nuovo Nothing Phone (3) in offerta su Am...
Roborock Qrevo Edge in offerta su Amazon...
Polizia statunitense mette in guardia: s...
EUREKA J15 Ultra ed Evo Ultra in offerta...
L'Olanda 'nazionalizza' il produttore di...
Robot Lefant M2 Pro in offerta su Amazon...
Ultimi 2 giorni di sconti sui dispositiv...
TP-Link è già proiettata a...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 11:18.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v