|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Nov 2007
Messaggi: 9050
|
[C#] Conversione delle stringhe
Help ragazzi, è la prima volta che mi imbatto nel problema della conversione delle stringhe.
In pratica devo estrarre delle stringhe da un file xml (premetto che non ho usato la system.xml per leggerlo perchè mi veniva più comodo leggerlo come testo), solo che in queste stringhe i caratteri come "&" ecc.. sono rappresentati come "&" ecc.. e inoltre nei nodi dove sono scritti dei percorsi di files gli spazi sono rappresentati come %20 e via discorrendo. Il file è codificato in utf-8, come faccio per ottenere una stringa senza simboli strani? (non ditemi che bastava usare la system.xml e che le conversioni le facevo mediante qualche funzione in quello spazio dei nomi altrimenti mi sparo ![]() |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
posta un pezzo di quel file..
__________________
![]() |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Nov 2007
Messaggi: 9050
|
Codice PHP:
il file è l'xml di libreria di iTunes. adesso il browser me lo converte in parte, fate che al posto dei "&" c'è il loro codice ascii. mentre ho notato che per le lettere accentate non mi mette l'ascii ma un altro codice, ad esempio per la "ù" mette "%C3%B9" e lo mette solo nella stringa in <key>location</key>: Codice PHP:
|
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Nov 2007
Messaggi: 9050
|
uppete
![]() |
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
mi ero dimenticato completamente..
![]() questo che ho appena scritto converte da UTF16 ad ascii, però il problema è che ho visto che alcune lettere (tipo quelle accentate) vengono codificate come due doppiette a 16 bit e non so in base a quale logica.. ![]() cmq ecco il codice: Codice:
Dictionary<string, string> toReplace = new Dictionary<string, string>(); string filename = "file://localhost/D:/Paolo/Musica/iTunes/iTunes%20Music/Artisti%20vari/Discoradio%20Compilation%202003/19%20La%20Trib%C3%B9%20Della%20Notte.mp3"; for (int i = 0; i < filename.Length; i++) { if (filename[i] == '%') { string asciiValue = "" + filename[i + 1] + filename[i + 2]; if (!toReplace.ContainsKey("%" + asciiValue)) { toReplace.Add("%" + asciiValue, "" + (char)Convert.ToInt32(asciiValue, 16)); } } } foreach (string key in toReplace.Keys) { filename = filename.Replace(key, toReplace[key]); } Console.WriteLine(filename); Console.ReadLine();
__________________
![]() Ultima modifica di ^TiGeRShArK^ : 21-11-2009 alle 11:20. |
![]() |
![]() |
![]() |
#6 | |
Senior Member
Iscritto dal: Nov 2007
Messaggi: 9050
|
Quote:
![]() per gli altri caratteri ti posto tutti quelli che ho trovato: Codice:
%5B [ %5D ] %C3%A8 ù %C3%A9 é %C3%A0 à %C3%B2 ò %C3%AC ì %25 % %C3%88 È %23 # %C3%B3 ó %C3%BA ú %C3%A1 á %C2%B0 ° ![]() ne approfitto per un altra domanda, devo copiare grosse quantità di files, ma quando lo faccio il programma si impalla finchè ha finito la copia (e poi ritorna a rispondere), per evitare che faccio?faccio fare la copia a un altro thread? |
|
![]() |
![]() |
![]() |
#7 | |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
Quote:
Ricordati che se devi fare un update della gui non puoi farlo assolutamente da un altro thread, ma devi farlo dal thread del dispatcher degli eventi (o come minGhia si chiama in C# ![]()
__________________
![]() |
|
![]() |
![]() |
![]() |
#8 |
Senior Member
Iscritto dal: Dec 2003
Messaggi: 4907
|
Per quei caratteri prova
System.Web.HttpUtility.HtmlDecode |
![]() |
![]() |
![]() |
#9 | ||
Senior Member
Iscritto dal: Nov 2007
Messaggi: 9050
|
Quote:
Quote:
comunque penso di aver risolto: ho trovato questa funzione per codificare da utf-8: Codice:
public static String unescape(String s) { StringBuilder sbuf = new StringBuilder(); int l = s.Length; int ch = -1; int b, sumb = 0; for (int i = 0, more = -1; i < l; i++) { /* Get next byte b from URL segment s */ switch (ch = s[i]) { case '%': ch = s[++i]; int hb = (Char.IsDigit((char)ch) ? ch - '0' : 10 + Char.ToLower((char)ch) - 'a') & 0xF; ch = s[++i]; int lb = (Char.IsDigit((char)ch) ? ch - '0' : 10 + Char.ToLower((char)ch) - 'a') & 0xF; b = (hb << 4) | lb; break; case '+': b = ' '; break; default: b = ch; break; } /* Decode byte b as UTF-8, sumb collects incomplete chars */ if ((b & 0xc0) == 0x80) { // 10xxxxxx (continuation byte) sumb = (sumb << 6) | (b & 0x3f); // Add 6 bits to sumb if (--more == 0) sbuf.Append((char)sumb); // Add char to sbuf } else if ((b & 0x80) == 0x00) { // 0xxxxxxx (yields 7 bits) sbuf.Append((char)b); // Store in sbuf } else if ((b & 0xe0) == 0xc0) { // 110xxxxx (yields 5 bits) sumb = b & 0x1f; more = 1; // Expect 1 more byte } else if ((b & 0xf0) == 0xe0) { // 1110xxxx (yields 4 bits) sumb = b & 0x0f; more = 2; // Expect 2 more bytes } else if ((b & 0xf8) == 0xf0) { // 11110xxx (yields 3 bits) sumb = b & 0x07; more = 3; // Expect 3 more bytes } else if ((b & 0xfc) == 0xf8) { // 111110xx (yields 2 bits) sumb = b & 0x03; more = 4; // Expect 4 more bytes } else /*if ((b & 0xfe) == 0xfc)*/ { // 1111110x (yields 1 bit) sumb = b & 0x01; more = 5; // Expect 5 more bytes } /* We don't test if the UTF-8 encoding is well-formed */ } return sbuf.ToString(); } ora io ho modificato la funzione che mi ha scritto prima tiger così: Codice:
Dictionary<string, string> toReplace = new Dictionary<string, string>(); for (int i = 0; i < a.Length; i++) { if ((a[i] == '&') && (a[i+1] == '#')) { string asciiValue = "" + a[i + 2] + a[i + 3]; if (!toReplace.ContainsKey("&#" + asciiValue)) { toReplace.Add("&#" + asciiValue, "" + (char)Convert.ToInt32(asciiValue)); } } } foreach (string key in toReplace.Keys) { a = a.Replace(key + ';', toReplace[key]); } grazie ancora a tutti e due ![]() |
||
![]() |
![]() |
![]() |
#10 | |
Senior Member
Iscritto dal: May 2004
Città: Londra (Torino)
Messaggi: 3692
|
Quote:
![]()
__________________
Se pensi che il tuo codice sia troppo complesso da capire senza commenti, e' segno che molto probabilmente il tuo codice e' semplicemente mal scritto. E se pensi di avere bisogno di un nuovo commento, significa che ti manca almeno un test. |
|
![]() |
![]() |
![]() |
#11 |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
![]() visto che ci sei come si chiama in C# il corrispettivo dell'EDT in java? ![]()
__________________
![]() |
![]() |
![]() |
![]() |
#12 | |
Senior Member
Iscritto dal: May 2004
Città: Londra (Torino)
Messaggi: 3692
|
Quote:
Sotto Winform si chiama "this". Nel senso che il sincronizzatore della finestra e' la finestra stessa, che espone direttamente Invoke per sincronizzare e aspettare, e BeginInvoke per sincronizzare ma dimenticarsi dell'effettivo risultato. Invoke da usarsi quindi quando si vuole eseguire qualcosa sul thread della finestra che restituira' un dato che mi serve (Quando leggo una qualche proprieta' grafica della finestra) BeginInvoke quando invece voglio solo accodare un messaggio nel bacino della pompa, e non mi interessa il risultato (Quando scrivo una qualche proprieta' grafica della finestra)
__________________
Se pensi che il tuo codice sia troppo complesso da capire senza commenti, e' segno che molto probabilmente il tuo codice e' semplicemente mal scritto. E se pensi di avere bisogno di un nuovo commento, significa che ti manca almeno un test. |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 01:06.