Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Display, mini PC, periferiche e networking: le novità ASUS al CES 2026
Display, mini PC, periferiche e networking: le novità ASUS al CES 2026
Sono molte le novità che ASUS ha scelto di presentare al CES 2026 di Las Vegas, partendo da una gamma di soluzioni NUC con varie opzioni di processore passando sino agli schermi gaming con tecnologia OLED. Il tutto senza dimenticare le periferiche di input della gamma ROG e le soluzioni legate alla connettività domestica
Le novità ASUS per il 2026 nel settore dei PC desktop
Le novità ASUS per il 2026 nel settore dei PC desktop
Molte le novità anticipate da ASUS per il 2026 al CES di Las Vegas: da schede madri per processori AMD Ryzen top di gamma a chassis e ventole, passando per i kit di raffreddamento all in one integrati sino a una nuova scheda video GeForce RTX 5090. In sottofondo il tema dell'intelligenza artificiale con una workstation molto potente per installazioni non in datacenter
Le novità MSI del 2026 per i videogiocatori
Le novità MSI del 2026 per i videogiocatori
Con le nuove soluzioni della serie MEG, acronimo di MSI Enthusiast Gaming, l'azienda taiwanese vuole proporre per il 2026 una gamma di proposte desktop che si rivolgono direttamente all'utente più appassionato con schede madri, chassis e sistemi di raffreddamento. Non da ultimi troviamo anche gli alimentatori, che abbinano potenza a ricerca della massima sicurezza di funzionamento.
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 07-02-2006, 13:26   #1
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
[PHP e SAX] Problema parsing

Sto sviluppando un guestbook in php che utilizza sax per parsare i dati memorizzati.
Ho notato che se all'interno dei file xml utilizzo caratteri accentati come à è ì ò ù, oppure £ e alcuni altri, mi restituisce "XML ERROR: Invalid character at line ..."
Come mai? come faccio a utilizzare questo tipo di caratteri?

Inoltre quando apro uno di questi file XML, se faccio una fread(), questa si blocca appena incontra un carattere "<".
E' un po' limitativo visto che devo leggere un file XML, che è pieno di questi caratteri..

C'è una soluzione?

Grazie
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 14:07   #2
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
Sto sviluppando un guestbook in php che utilizza sax per parsare i dati memorizzati.
Ho notato che se all'interno dei file xml utilizzo caratteri accentati come à è ì ò ù, oppure £ e alcuni altri, mi restituisce "XML ERROR: Invalid character at line ..."
Come mai? come faccio a utilizzare questo tipo di caratteri?
Cosa hai messo nella dichiarazione dell'XML?? Se metti ad esempio:
Codice:
<?xml version="1.0" encoding="ISO-8859-1"?>
non dovresti avere problemi.

Quote:
Originariamente inviato da DoubleAJ
Inoltre quando apro uno di questi file XML, se faccio una fread(), questa si blocca appena incontra un carattere "<".
E' un po' limitativo visto che devo leggere un file XML, che è pieno di questi caratteri..
Il codice per leggere (tramite parser) un file XML in PHP tipicamente è simile a questo:
Codice:
$xml_parser = xml_parser_create ();

...imposta altre opzioni del parser...

$handle = @fopen ("nome_file.xml", "r");

if ($handle !== FALSE)
{
    while ($data = fread ($handle, 4096))
        if (!xml_parse ($xml_parser, $data, feof ($handle)))
            die ("XML error");

    fclose ($handle);
}

xml_parser_free ($xml_parser);
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 14:28   #3
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
L'errore era causato dal fatto che avevo tralasciato questa parte di dichiarazione: encoding="ISO-8859-1"
Però ora al posto dell'errore mi visualizza i caratteri sbagliati:
per esempio se sul file scrivo: à è ì ò ù £ %
il parser mi legge: à è ì ò ù £ %
Forse c'è un altro tipo di encoding...

Passando all'altro argomento, il problema è qui:
$data = fread ($handle, 4096))
La fread() e anche la fgets(), se nel file è presente il carattere < , dentro $data inseriscono il contenuto del file fino alla prima occorrenza di < , dopodichè termina come se quel carattere lo riconoscesse come end of file.
Se per esempio nel file ho scritto: "ciao com<e stai"
dentro $data mi ritroverò questo "ciao com"

La cosa strana è che se uso file_get_contents() questo non succede...
Il fatto è che non volevo leggere sempre tutto il file, perchè col passare del tempo i messaggi diventano diverse migliaia, e parsare un file enorme ogni volta che si chiama una pagina diventa costoso, soprattutto in termini di tempo penso..

Ultima modifica di DoubleAJ : 07-02-2006 alle 14:32.
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 15:08   #4
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
L'errore era causato dal fatto che avevo tralasciato questa parte di dichiarazione: encoding="ISO-8859-1"
Però ora al posto dell'errore mi visualizza i caratteri sbagliati:
per esempio se sul file scrivo: à è ì ò ù £ %
il parser mi legge: à è ì ò ù £ %
Uhm ..... a naso questi caratteri sanno di codifica UTF-8! Cioè mi sembra la codifica UTF-8 su 2 byte 110xxxxx 10xxxxxx.
Ma, tanto per sapere, la pagina HTML che crei quale charset ha??

Quote:
Originariamente inviato da DoubleAJ
Passando all'altro argomento, il problema è qui:
$data = fread ($handle, 4096))
La fread() e anche la fgets(), se nel file è presente il carattere < , dentro $data inseriscono il contenuto del file fino alla prima occorrenza di < , dopodichè termina come se quel carattere lo riconoscesse come end of file.
Se per esempio nel file ho scritto: "ciao com<e stai"
dentro $data mi ritroverò questo "ciao com"
Ti posso garantire (e non solo io) che la fread legge esattamente gli N caratteri richiesti (l'ultimo blocco letto dal file può essere più piccolo, questo è ovvio).
Come fai a dire che in $data ti ritrovi solo "ciao com"??? Hai fatto un echo $data; sulla pagina HTML??? Se così, certo che non ti trovi i <. Perché vengono visti come dei tag.
Comunque a te non dovrebbe interessare il blocco in $data. È la funzione xml_parse che si occupa di analizzare i dati e chiamare man mano le funzioni di callback definite!
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 15:31   #5
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
Perfetto! Bisognava cambiare il charset della pagina html da iso-8859-1 a UTF-8...
Ora tenendo il file xml in ISO-8859-1 e la pagina html a UTF-8 mi visualizza bene..

Grazie!

Ora guardo bene anche per il problema della fread()...
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 16:09   #6
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
Perfetto! Bisognava cambiare il charset della pagina html da iso-8859-1 a UTF-8...
Ora tenendo il file xml in ISO-8859-1 e la pagina html a UTF-8 mi visualizza bene..
Scusa, ma se prima nella tua pagina web vedevi i caratteri strani à è ì ò ù £ %, vuol dire che il file XML lo avevi (e penso lo hai tuttora) in UTF-8 e la pagina web la avevi in ISO-8859-1, dico bene?
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 16:28   #7
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
Quando vedevo male i caratteri avevo sia la pagina html che il file xml in iso-8859-1.
Ora, cambiando solo la pagina html in UTF-8 vedo tutto bene...
Non chiedermi perchè, in effetti non ha molto senso...
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 16:46   #8
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
Quando vedevo male i caratteri avevo sia la pagina html che il file xml in iso-8859-1.
Ora, cambiando solo la pagina html in UTF-8 vedo tutto bene...
Non chiedermi perchè, in effetti non ha molto senso...
Ah ... ecco, qualcosa non mi quadrava!
Vuol dire, molto probabilmente, che nonostante tu abbia specificato il charset iso-8859-1 nel file xml (nella prima riga), hai dentro il file dei caratteri codificati come UTF-8.
Non so come hai fatto il file xml, cioè con quale tool o editor.
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 16:53   #9
DoubleAJ
Senior Member
 
Iscritto dal: Nov 2004
Messaggi: 326
...wordpad...
Però nel salvataggio ho lasciato la codifica ansi.
DoubleAJ è offline   Rispondi citando il messaggio o parte di esso
Old 07-02-2006, 17:21   #10
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DoubleAJ
...wordpad...
Però nel salvataggio ho lasciato la codifica ansi.
Uh ... molto strano!
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Display, mini PC, periferiche e networking: le novità ASUS al CES 2026 Display, mini PC, periferiche e networking: le n...
Le novità ASUS per il 2026 nel settore dei PC desktop Le novità ASUS per il 2026 nel settore de...
Le novità MSI del 2026 per i videogiocatori Le novità MSI del 2026 per i videogiocato...
I nuovi schermi QD-OLED di quinta generazione di MSI, per i gamers I nuovi schermi QD-OLED di quinta generazione di...
Recensione vivo X300 Pro: è ancora lui il re della fotografia mobile, peccato per la batteria Recensione vivo X300 Pro: è ancora lui il...
MachineGames è pronta a chiudere ...
Certificato scaduto manda in tilt le app...
Mova presenta i nuovi robot tagliaerba L...
Non solo aspirapolvere per Dreame: dai f...
SanDisk manda in pensione WD Black e WD ...
Smartphone in offerta su Amazon: Motorol...
OpenAI lancia ChatGPT Health, il nuovo a...
Narwal V40 Station: l'aspirapolvere con ...
BYD dichiara guerra alle auto con cinghi...
Stufe elettriche in offerta su Amazon: c...
Non solo RGB: TRYX porta schermi IPS su ...
Robot aspirapolvere Narwal in super offe...
Micron avvia la costruzione della MegaFa...
Samsung Galaxy S25 in offerta su Amazon:...
Cheeseburger e chip a 2 nanometri: la pr...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 10:57.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v