PDA

View Full Version : [C#] Rimuovere tutti i nodi di un tipo da file xml


sonytae
13-08-2010, 21:02
Salve a tutti, ho un documento di questo tipo:

<?xml version="1.0" encoding="UTF-8" ?>
- <zucchine xmlns="ciccio">
<Id>urn:uuid:8f27991d-3adb-4a8f-9c7b-c655606bdd2e</Id>
<Abaabababa>Fuffa</Abaabababa>
<cacacacaca>2080-08-16T02:19:23+01:00</cacacacaca>
<mustafa>pippo</mustafa>
<Creator>Mamma</Creator>
<alibaba>Nonno</alibaba>
<pluto>Zio</pluto>
- <plutino>
<Id>1</Id>
<LabelText>AA</LabelText>
</plutino>
<RatingList />
- <TopolinoList>
- <Topolino>
<Id>urn:uuid:da61bb01-016c-45b7-aaac-f6da986e9f0a</Id>
- <Minnie>
- <paperino>
<Id>urn:uuid:b8776053-3cf5-47db-92bc-44b18db1cd4d</Id>
<orazio>24 1</orazio>
<clarabella>24958</clarabella>
<peppa>192</peppa>
<nonnapapera>24624</nonnapapera>
<paperone>urn:uuid:3b36ccee-6b14-4f64-84a9-219c5ac6cf34</paperone>
<claudio>6jLbJM6P62MO86T3qQy7iTuImPY=</claudio>
<frutta>24 1</frutta>
<verdura>2.39</verdura>
</paperino>
- <patate>
<Id>urn:uuid:34c002a4-91bd-4a98-b0e4-81e6a7d5d752</Id>
<orazio>24 1</orazio>
<clarabella>24958</clarabella>
<peppa>192</peppa>
<nonnapapera>24624</nonnapapera>
<paperone>urn:uuid:a8cc8278-a04b-4536-8c89-f82d7fc3fcfe</paperone>
<claudio>FdiJNVTHJXTsxff7F/61OiFbCOs=</claudio>
</patate>
</Minnie>
</Topolino>
- <Topolino>
<Id>urn:uuid:ee72a83f-9de8-412d-9ed4-c40f28fc1e65</Id>
- <Minnie>
- <paperino>
<Id>urn:uuid:8c39ce5a-3516-41c9-8468-336f2263425a</Id>
<orazio>24 1</orazio>
<clarabella>30579</clarabella>
<peppa>192</peppa>
<nonnapapera>30245</nonnapapera>
<paperone>urn:uuid:04fbf8a2-4848-4cf2-aa6b-493164f34323</paperone>
<claudio>6SraImBYxsyTmgSrhgW6Vios5uk=</claudio>
<frutta>24 1</frutta>
<verdura>2.39</verdura>
</paperino>
- <patate>
<Id>urn:uuid:9bb3290e-0526-49bc-bfc6-b9828f61c129</Id>
<orazio>24 1</orazio>
<clarabella>30579</clarabella>
<peppa>192</peppa>
<nonnapapera>30245</nonnapapera>
<paperone>urn:uuid:3a108443-fa98-4d96-9325-65e71e61e5a9</paperone>
<claudio>bqx6K0baRUvBUHezNRkaLQ2hc9U=</claudio>
</patate>
</Minnie>
</Topolino>
- <Topolino>
<Id>urn:uuid:5d679210-1883-430d-87ea-b990cddb95fa</Id>
- <Minnie>
- <paperino>
<Id>urn:uuid:c57a2e3b-3094-4ec5-bc51-ab34255fb59a</Id>
<orazio>24 1</orazio>
<clarabella>31726</clarabella>
<peppa>192</peppa>
<nonnapapera>31392</nonnapapera>
<paperone>urn:uuid:ca303a56-e853-46b5-966a-6cfcda70d35f</paperone>
<claudio>XL03UHrYQnNiiJ8DdytM+JWCSqk=</claudio>
<frutta>24 1</frutta>
<verdura>2.39</verdura>
</paperino>
- <patate>
<Id>urn:uuid:f04737a9-a1ae-41cb-b9cc-d98c7a7c5dfc</Id>
<orazio>24 1</orazio>
<clarabella>31726</clarabella>
<peppa>192</peppa>
<nonnapapera>31392</nonnapapera>
<paperone>urn:uuid:1634e32e-6add-4303-9655-bc11615a6032</paperone>
<claudio>mSl0JIrB366sCma7Oft9dwCFqv4=</claudio>
</patate>
</Minnie>
</Topolino>
- <Topolino>
<Id>urn:uuid:e1b0b76b-059d-458a-8c78-7cb53a67976c</Id>
- <Minnie>
- <paperino>
<Id>urn:uuid:d5428a0c-d3bf-4db6-b620-d7ac861b4998</Id>
<orazio>24 1</orazio>
<clarabella>28741</clarabella>
<peppa>192</peppa>
<nonnapapera>28407</nonnapapera>
<paperone>urn:uuid:3cad8310-01ce-4910-98f8-b0cad23ea621</paperone>
<claudio>0ACI6cvFS6ByjRtfMeKgS0MuGj0=</claudio>
<frutta>24 1</frutta>
<verdura>2.39</verdura>
</paperino>
- <patate>
<Id>urn:uuid:b70904e3-e78d-429f-bceb-b56767e168d3</Id>
<orazio>24 1</orazio>
<clarabella>28741</clarabella>
<peppa>192</peppa>
<nonnapapera>28407</nonnapapera>
<paperone>urn:uuid:22f801a4-ec58-4e9a-bd87-ea14e53509b8</paperone>
<claudio>S7hN3kkABeTf2eAuCG3puD+d17g=</claudio>
</patate>
</Minnie>
</Topolino>
- <Topolino>
<Id>urn:uuid:9864be61-58c9-44d8-8c36-46366d11b067</Id>
- <Minnie>
- <paperino>
<Id>urn:uuid:9f16145c-2322-466f-88ba-8f842232fe7f</Id>
<orazio>24 1</orazio>
<clarabella>28488</clarabella>
<peppa>192</peppa>
<nonnapapera>28154</nonnapapera>
<paperone>urn:uuid:d098799f-c690-46c4-991d-561e4fa61747</paperone>
<claudio>XwXFkt9pHOYQb5Y/k9gfZq4l5qY=</claudio>
<frutta>24 1</frutta>
<verdura>2.39</verdura>
</paperino>
- <patate>
<Id>urn:uuid:5ab8a4f2-2a98-4da3-ab5a-3bd21b739356</Id>
<orazio>24 1</orazio>
<clarabella>28488</clarabella>
<peppa>192</peppa>
<nonnapapera>28154</nonnapapera>
<paperone>urn:uuid:8d6dfbee-f798-495f-be42-5cb825e5692c</paperone>
<claudio>1q9VI2ojAY4Efrqsg30hM42ZKzE=</claudio>
</patate>
</Minnie>
</Topolino>
- <Topolino>
<Id>urn:uuid:9c7661d5-59b6-45c2-bfbe-c6717dfccb82</Id>
- <Minnie>
- <paperino>
<Id>urn:uuid:13205cae-50eb-4878-a082-5b9a5df7af40</Id>
<orazio>24 1</orazio>
<clarabella>26463</clarabella>
<peppa>192</peppa>
<nonnapapera>25968</nonnapapera>
<paperone>urn:uuid:2a1a2d88-ea12-41e2-b8a5-aff82fc2e62e</paperone>
<claudio>RByY+rW7FJL3psYEp+MSawNbRyk=</claudio>
<frutta>24 1</frutta>
<verdura>2.39</verdura>
</paperino>
- <patate>
<Id>urn:uuid:41f87154-fb74-494f-9070-e14bf79a774b</Id>
<orazio>24 1</orazio>
<clarabella>26463</clarabella>
<peppa>192</peppa>
<nonnapapera>25968</nonnapapera>
<paperone>urn:uuid:65b276db-e2ac-432f-8df8-747cd26d8752</paperone>
<claudio>CR3zt1mkesdmJtWbr8u0xPtepDg=</claudio>
</patate>
</Minnie>
</Topolino>
</TopolinoList>
</zucchine>
- <!-- Generated -->

Sto cercando un modo per fare un programmino C# con Visual Studio 2010 che mi consenta di riscriverlo identico ma senza i nodi:

<paperone>urn:uuid:65b276db-e2ac-432f-8df8-747cd26d8752</paperone>


non posso ovviamente semplicemente editarlo con frontpage perchè il contenuto cambia sempre, quello che resta fisso è solo

<paperone>-----</paperone>

Ho provato a fare un prog del tipo

using System;
using System.Xml;

namespace Premove
{

class RemovePaperone
{
static void Main(string[] args)
{
string sorg = args[0];
XmlDocument dest = new XmlDocument();
dest.Load(sorg);

XmlNodeList k = source.GetElementsByTagName("Paperone");
for (int i = 0; i < k.Count ; i++)
{
// Console.WriteLine(k[i].InnerXml);

k[i].ParentNode.RemoveChild(k[i]);
}


dest.save("out.xml");
}}}


ma non funziona, o meglio mi leva solo una metà dei Paperone,


Ho provato anche con :

XmlNodeList k = source.GetElementsByTagName("Paperone");

XmlNodeList a = source.GetElementsByTagName("Paperino");

XmlNodeList b = source.GetElementsByTagName("Patate");


for (int i = 0; i < k.Count ; i++)
{
// Console.WriteLine(k[i].InnerXml);

// k[i].ParentNode.RemoveChild(k[i]);

int c = i+i;

a[i].RemoveChild(k[c]);
b[i].RemoveChild(k[c++]);


ma la cosa non va lo stesso, anzi dice che i nodi selezionati non sono figli di quello padre.



Se rimuovo il commento, Il comando commentato // Console.WriteLine(k[i].InnerXml); però fornisce i valori giusti sul terminale.

Non so davvero come fare, grazie a tutti per l'aiuto.

VICIUS
13-08-2010, 21:49
Probabilmente il modo più veloce ed immediato è usare l'oggetto Regex e la funzione replace.

Come espressione regolare questa dovrebbe andare bene:
<paperone>.+?</paperone>

sonytae
13-08-2010, 22:05
intendi una cosa del genere?

using System;
using System.Xml;
using System.Text.RegularExpressions;


namespace Premove
{

class RemoveP
{
static void Main(string[] args)
{
string sorg = args[0];
string pattern = "<Paperone>.+?</Paperone>";
string replacement = " ";
Regex rgx = new Regex(pattern);

XmlTextReader xml = new XmlTextReader(sorg);
XmlDocument dest = new XmlDocument();
dest.Load(xml);

while (xml.Read())
{

string result = xml.Replace(rgx, replacement);


}






dest.save("out.xml");
}
}
}



Il problema è che il compilatore non lo accetta non so come leggere e copiare da un file all'altro mentre fa l'operazione che mi hai suggerito, oppure per caso si può fare così?:

using System;
using System.Xml;
using System.Text.RegularExpressions;


namespace Premove
{

class RemovePaperone
{
static void Main(string[] args)
{
string sorg = args[0];

XmlDocument dest = new XmlDocument();
dest.Load(sorg);






dest.save("out.xml");
}
}
}


ed agire direttamente sul file caricato col comando RegEx? Ti sarei molto grato se mi potessi dire come inseire tale comando perchè nn l'ho mai usato.
Grazie.

astorcas
13-08-2010, 23:26
non so se ho capito bene ma non potrebbe bastare una cosa del tipo:


XDocument doc = XDocument.Load("DocumentoDaCaricare.xml");
doc.Descendants("Paperone").Remove();
doc.Save("DocumentoDaSalvare.xml");


?

XDocument lo trovi nel namespace System.Xml.Linq

sonytae
14-08-2010, 08:05
potrebbe bastare una cosa del tipo

Purtroppo non va, non ha alcun effetto, ricopia in uscita su DocumentoDaSalvare.xml lo stesso documento originale senza alcuna modifica.

Sembra che non riesca ad individuare i nodi dal Tag, grazie cmq per avermi risposto

Con la XmlNodeList invece li seleziona tutti, se però faccio ad es .RemoveAll() mi riscrive il doc lasciando: <Paperone />, cioè Leva solo l'innerText, l'effetto è lo stesso infatti del comando che rimpiazza l'innerText con " " (ho provato anche quello).

VICIUS
14-08-2010, 08:19
ed agire direttamente sul file caricato col comando RegEx? Ti sarei molto grato se mi potessi dire come inseire tale comando perchè nn l'ho mai usato.
Grazie.
Purtroppo non ho un sistema windows sotto mano quindi mi tocca andare a memoria. Basta che carichi il file in una stringa come fosse un normale file di testo senza fare il parsing xml come stai facendo ora. Poi usi l'oggetto regex che hai creato.

string fileXml = caricaFileXml();
Regex regex = new Regex(pattern);
string fileSenzaPaperone = regex.replace(fileXml, "");
scriviFileXml(fileSenzaPaperone);

sonytae
14-08-2010, 10:05
Ecco come ho scritto il prog cercando di aggiungere il rimpiazzo di regex:

// The function KeyId will delete all of the <KeyId> nodes
using System;
using System.Xml;
using System.Text.RegularExpressions;
using System.Xml.Linq;
using System.IO;


namespace Premove
{

class RemoveK
{
static void Main(string[] args)
{

string sorg = args[0];


string pattern = "<Paperone>.+?</Paperone>";
string replacement = " ";
string fileXml = GetXmlString(sorg);

// XmlTextReader xml = new XmlTextReader(sorg);

// string fileXml = caricaFileXml();

Regex regex = new Regex(pattern);
string fileSenzak = regex.Replace(fileXml,replacement);

XmlDocument finale = new XmlDocument();
finale.Load(fileSenzak);
finale.Save("clean.Xml");


// XDocument dest = XDocument.Load("cpl.xml");
// dest.Load(sorg);

// while (xml.Read())
// {

//string result = xml.Replace(rgx, replacement);


//}

//dest.Descendants("MainPicture").Remove<XNode>();


// dest.Save("Clean.xml");
}

static string GetXmlString(string strFile)
{
// Load the xml file into XmlDocument object.
XmlDocument xmlDoc = new XmlDocument();
try
{
xmlDoc.Load(strFile);
}
catch (XmlException e)
{
Console.WriteLine(e.Message);
}
// Now create StringWriter object to get data from xml document.
StringWriter sw = new StringWriter();
XmlTextWriter xw = new XmlTextWriter(sw);
xmlDoc.WriteTo(xw);
return sw.ToString();
}
}
}



ed ecco l'errore che mi da

Unhandled Exception: System.ArgumentException: Illegal characters in path.
at System.IO.Path.CheckInvalidPathChars(String path)
at System.IO.Path.NormalizePath(String path, Boolean fullCheck, Int32 maxPath
Length)
at System.IO.Path.GetFullPathInternal(String path)
at System.IO.Path.GetFullPath(String path)
at System.Xml.XmlResolver.ResolveUri(Uri baseUri, String relativeUri)
at System.Xml.XmlUrlResolver.ResolveUri(Uri baseUri, String relativeUri)
at System.Xml.XmlTextReaderImpl..ctor(String url, XmlNameTable nt)
at System.Xml.XmlDocument.Load(String filename)
at Premove.RemoveK.Main(String[] args)

Il compilatore mi dice che è a livello sintassi è OK; ma nn va

VICIUS
14-08-2010, 10:40
Sei sicuro che il metodo Load sia in grado di caricare un file xml da una stringa? Altrimenti stai semplicemente dicendo alla classe di leggere un file da un percorso assurdo e ti da errore.

sonytae
14-08-2010, 12:44
La funzione l'ho trovata qui:

http://www.netomatix.com/XmlFileToString.aspx

non mi da errore e gli so passando una stringa che contiene il path del file sorgente xml che è nella stessa cartelal dell'eseguibile ovviamente


Edit: ho risolto "alla vecchia maniera" con un prog in C che apre il file come ASCII cerca la stringa <Paperone> e nel nuovo file non scrive più nulla fino a che non è finita </Paperone>, fatto con un ciclo do-while e getc() e putc(), sembra che funzioni, ma secndo voi ci sono controindicazioni?

Kenger
14-08-2010, 18:33
Mi sa che il problema del tuo programma in C# è quello che ti hanno già detto. Il metodo Load di XmlDocument vuole un percorso o simili da cui caricare un file XML. A te serve il metodo LoadXml a cui passerai come parametro "fileSenzak".

Il programma in C funzionerà anche ma leggendo la documentazione della classe XmlDocument con relativi esempi mi ci sono voluti 2 minuti a risponderti. ^^
Ti consiglio sempre di cercare su msdn la classe e vedere che metodi ha... oppure usare visual studio e il suo autocompletamento, strumento fantastico per C#.