|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Sep 2003
Città: Lucca
Messaggi: 379
|
[c#]Creare un parser XML: da dove iniziare?
Salve per un esame universitario devo creare un nuovo linguaggio di mashup che estenda html con nuovi tag da me definiti.
Mi viene chiesto di creare una gerarchia di classi e di scrivere un parser xml che ne analizza il testo e ne costruisce la rappresentazione con tali classi. Il mio problema è solo uno: da dove partire :-D Come faccio in c# a costruire una classe che prende in input un testo scritto contenente il linguaggio html + nuovi tag e restituisce come output una file xml valido? esiste qualche namespace specifico che può fare la caso mio?
__________________
God rides DUCATI! |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
![]() ad occhio direi che devi creare un programma che parsi l'xhtml e non l'html. In quel modo pui trattare il file come un normalissimo file xml e quindi effettuare quello che vuoi con i nuovi tag che andrai a definirti.. o sbaglio? ![]()
__________________
![]() |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Sep 2003
Città: Lucca
Messaggi: 379
|
Mi richiedono esplicitamente HTML...
Valli a capire.... ![]()
__________________
God rides DUCATI! |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
...e che senso ha?
![]() è da masochisti usare un parser html per ottenere l'xhtml e quindi esaminarlo con un parser XML ![]() cmq in C# per l'xml c'è tutto il namespace System.Xml, mentre per l'html il primo che ho trovato con google è questo: http://www.devincook.com/goldparser/index.htm e queste sono le grammatiche: http://www.devincook.com/goldparser/...tm#FileFormats Per il resto non l'ho mai fatto in pratica perchè il C# lo sto imparando on-the-fly dato che ultimamente ho programmato principalmente in java ![]()
__________________
![]() |
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Aug 2005
Messaggi: 2755
|
Se ti serve XML (non so come si comporti con HTML) prova a buttare un occhio a linq to XML
http://blogs.msdn.com/pietrobr/archi...enti-linq.aspx
__________________
|
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Sep 2003
Città: Lucca
Messaggi: 379
|
Provo a riportare le specifiche che mi hanno dato... che trovo molto aleatorie
Casomai ditemi secondo voi quali sono gli strumenti migliori per realizzare quanto mi chiedono (c#/Java, Classi da creare, ecc...) Il mio prof in questo momento sarà a sciare alla faccia nostra, io e molti miei colleghi stiamo invece smadonnando nel capire cosa deve fare cosa... Se qualcuno di voi ha già familiarità con i linguaggi di mashup e può indicarci una via.... sappia che fa un bel regalo di Natale a un gruppo di informatici :-D Problema Si vuole sviluppare un linguaggio di mashup, che consiste in un estensione di HTML con alcuni tag per comporre mashup. Pagine scritte in questo linguaggio devono venire elaborate da un generatore di codice che produce una nuova pagina HTML contenente opportuno codice JavaScript per aggiornare dinamicamente il contenuto. Si consideri il seguente esempio, contenuto nel file news.paml: Codice:
<html> <body> <table style="width: 100%"> <tr><th>News results</th></tr> <pa:list id="feed" data="http://pipes.yahoo.com/pipes/pipe.run?_id=gqfCUnKT3BGdQg01ouNLYQ&_render=json”> <tr><td><pa:link ref="link"/><br/><pa:html ref="description"/></td> </tr> </pa:list> </table> </body></html> L’elemento <pa:link ref="field"> rappresenta un’anchor HTML e va sostituito con un elemento <a href=”url”>url</a> dove url è ottenuto estraendo il campo indicato dall’attributo field dall’elemento corrente della lista. L’elemento <pa:html ref="field"/> rappresenta un testo HTML e va sostituito con il testo estratto dal campo indicato dall’attributo field dall’elemento corrente della lista. Gli elementi pa:link e pa:html possono essere presenti solo all’interno di un elemento pa:list mentre questi ultimi non possono essere annidati. Il generatore produrrà una pagina news.html simile alla seguente: Codice:
<html><head> <script language="javascript" src="mashup.js"></script> <script> var feed = new Pa.List("http://pipes.yahoo.com/pipes/pipe.run?_id=gqfCUnKT3BGdQg01ouNLYQ&_render=json"); feed.update = function() { var el = document.getElementById("feed"); // invia la richiesta di dati e modifica el in base ai dati ottenuti function listCallback(req) { … } sendRequest("/redirect/to?" + feed.url, listCallBack); } </script> </head><body onload="feed.update()"> <table style="width: 100%"> <tr><th>News results</th></tr> <div id="feed"></div> </table> </body></html> Esercizio 1 Definire una gerarchia di classi adatte per descrivere gli elementi del linguaggio di mashup suddetto. Scrivere un parser, usando una libreria di parsing XML a scelta, che analizza un testo nel linguaggio di mashup e ne costruisce la rappresentazione con tali classi.
__________________
God rides DUCATI! |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
![]() così a vederlo ad occhio direi che è possibile farlo anche semplicemente usando XSLT addirittura, perchè, a parte una o due "/" che mi sa che sono un errore quel documento dovrebbe essere conforme allo standard xhtml e inoltre la sua struttura mi sa che si presta piuttosto bene ad essere modificato tramite XSLT. Ma se non potte usare xslt allora vi basterebbe un qualsiasi parser XML, come il namespace System.xml di C#, e trasformate il primo documento xhtml nel secondo mediante l'analisi dei vostri tag personali. Da notare il "trasformate" in corsivo dato che è appunto quello che fa XSLT ![]()
__________________
![]() |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 08:13.