View Full Version : [c#]Creare un parser XML: da dove iniziare?
DesmoColo
24-12-2007, 13:26
Salve per un esame universitario devo creare un nuovo linguaggio di mashup che estenda html con nuovi tag da me definiti.
Mi viene chiesto di creare una gerarchia di classi e di scrivere un parser xml che ne analizza il testo e ne costruisce la rappresentazione con tali classi.
Il mio problema è solo uno: da dove partire :-D
Come faccio in c# a costruire una classe che prende in input un testo scritto contenente il linguaggio html + nuovi tag e restituisce come output una file xml valido? esiste qualche namespace specifico che può fare la caso mio?
^TiGeRShArK^
24-12-2007, 13:29
:mbe:
ad occhio direi che devi creare un programma che parsi l'xhtml e non l'html.
In quel modo pui trattare il file come un normalissimo file xml e quindi effettuare quello che vuoi con i nuovi tag che andrai a definirti.. o sbaglio? :fagiano:
DesmoColo
24-12-2007, 13:49
Mi richiedono esplicitamente HTML...
Valli a capire....:D
^TiGeRShArK^
24-12-2007, 14:10
Mi richiedono esplicitamente HTML...
Valli a capire....:D
...e che senso ha? :mbe:
è da masochisti usare un parser html per ottenere l'xhtml e quindi esaminarlo con un parser XML :asd:
cmq in C# per l'xml c'è tutto il namespace System.Xml, mentre per l'html il primo che ho trovato con google è questo:
http://www.devincook.com/goldparser/index.htm
e queste sono le grammatiche:
http://www.devincook.com/goldparser/grammars/index.htm#FileFormats
Per il resto non l'ho mai fatto in pratica perchè il C# lo sto imparando on-the-fly dato che ultimamente ho programmato principalmente in java :p
Se ti serve XML (non so come si comporti con HTML) prova a buttare un occhio a linq to XML
http://blogs.msdn.com/pietrobr/archive/2007/09/25/studenti-linq.aspx
DesmoColo
24-12-2007, 16:47
Provo a riportare le specifiche che mi hanno dato... che trovo molto aleatorie
Casomai ditemi secondo voi quali sono gli strumenti migliori per realizzare quanto mi chiedono (c#/Java, Classi da creare, ecc...)
Il mio prof in questo momento sarà a sciare alla faccia nostra, io e molti miei colleghi stiamo invece smadonnando nel capire cosa deve fare cosa...
Se qualcuno di voi ha già familiarità con i linguaggi di mashup e può indicarci una via.... sappia che fa un bel regalo di Natale a un gruppo di informatici :-D
Problema
Si vuole sviluppare un linguaggio di mashup, che consiste in un estensione di HTML con alcuni tag per comporre mashup. Pagine scritte in questo linguaggio devono venire elaborate da un generatore di codice che produce una nuova pagina HTML contenente opportuno codice JavaScript per aggiornare dinamicamente il contenuto.
Si consideri il seguente esempio, contenuto nel file news.paml:
<html>
<body>
<table style="width: 100%">
<tr><th>News results</th></tr>
<pa:list id="feed"
data="http://pipes.yahoo.com/pipes/pipe.run?_id=gqfCUnKT3BGdQg01ouNLYQ&_render=json”>
<tr><td><pa:link ref="link"/><br/><pa:html ref="description"/></td>
</tr>
</pa:list>
</table>
</body></html>
L’elemento <pa:list> rappresenta una lista di valori JavaScript, ottenuti effettuando una richiesta alla url indicata nell’attributo data, per mezzo di un oggetto XMLHttpRequest, convertendo il risultato della richiesta codificato in JSON in un oggetto JavaScript, ed estraendone il campo value.items. Il risultato d cosí ottenuto sarà visualizzato utilizzando l’HTML contenuto nell’elemento <pa:list> ripetutamente per ciascun elemento di d.
L’elemento <pa:link ref="field"> rappresenta un’anchor HTML e va sostituito con un elemento <a href=”url”>url</a> dove url è ottenuto estraendo il campo indicato dall’attributo field dall’elemento corrente della lista.
L’elemento <pa:html ref="field"/> rappresenta un testo HTML e va sostituito con il testo estratto dal campo indicato dall’attributo field dall’elemento corrente della lista.
Gli elementi pa:link e pa:html possono essere presenti solo all’interno di un elemento pa:list mentre questi ultimi non possono essere annidati.
Il generatore produrrà una pagina news.html simile alla seguente:
<html><head>
<script language="javascript" src="mashup.js"></script>
<script>
var feed = new Pa.List("http://pipes.yahoo.com/pipes/pipe.run?_id=gqfCUnKT3BGdQg01ouNLYQ&_render=json");
feed.update = function() {
var el = document.getElementById("feed");
// invia la richiesta di dati e modifica el in base ai dati ottenuti
function listCallback(req) {
…
}
sendRequest("/redirect/to?" + feed.url, listCallBack);
}
</script>
</head><body onload="feed.update()">
<table style="width: 100%">
<tr><th>News results</th></tr>
<div id="feed"></div>
</table>
</body></html>
La libreria mashup.js contiene alcune funzioni di utilità JavaScript.
Esercizio 1
Definire una gerarchia di classi adatte per descrivere gli elementi del linguaggio di mashup suddetto. Scrivere un parser, usando una libreria di parsing XML a scelta, che analizza un testo nel linguaggio di mashup e ne costruisce la rappresentazione con tali classi.
^TiGeRShArK^
24-12-2007, 17:22
:fagiano:
così a vederlo ad occhio direi che è possibile farlo anche semplicemente usando XSLT addirittura, perchè, a parte una o due "/" che mi sa che sono un errore quel documento dovrebbe essere conforme allo standard xhtml e inoltre la sua struttura mi sa che si presta piuttosto bene ad essere modificato tramite XSLT.
Ma se non potte usare xslt allora vi basterebbe un qualsiasi parser XML, come il namespace System.xml di C#, e trasformate il primo documento xhtml nel secondo mediante l'analisi dei vostri tag personali.
Da notare il "trasformate" in corsivo dato che è appunto quello che fa XSLT:fagiano:
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.