PDA

View Full Version : Strip di caratteri con C


bakkasel
24-04-2007, 12:39
ciao a tutti,
ho un file di testo in utf-8, con al suo interno alcuni caratteri utf-16 che vengono visti come 2 caratteri "strani" utf-8

il codice in ottale C del carattere da eliminare è \302\222

come posso fare un programmino in C che leggendo due caratteri alla volta ogni volta che trova \322\222 li elimina dal testo?

grazie
claus

andbin
24-04-2007, 18:57
ciao a tutti,
ho un file di testo in utf-8, con al suo interno alcuni caratteri utf-16 che vengono visti come 2 caratteri "strani" utf-8

il codice in ottale C del carattere da eliminare è \302\222

come posso fare un programmino in C che leggendo due caratteri alla volta ogni volta che trova \322\222 li elimina dal testo?La sequenza \302\222 (C2h 92h) mi risulta che sia una sequenza corretta in UTF-8.
In UTF-8 un singolo carattere Unicode può essere rappresentato con una sequenza da 1 a 6 byte.

EDIT: ho verificato adesso: la sequenza C2h 92h in utf-8 rappresenta il codice Unicode U+0092, che è un carattere definito "di controllo" (quindi non è un carattere visibile). Perché hai una sequenza del genere, non ne ho idea ..... Potrebbe essere che non sia utf-8 ma qualcos'altro.