Torna indietro   Hardware Upgrade Forum > Software > Programmazione

PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu
PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu
Il modello "build to order" di PCSpecialist permette di selezionare una struttura base per un sistema, personalizzandolo in base alle specifiche esigenze con una notevole flessibilità di scelta tra i componenti. Il modello Lafité 14 AI AMD è un classico notebook clamshell compatto e potente, capace di assicurare una elevata autonomia di funzionamento anche lontano dalla presa di corrente
Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto
Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto
Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine, arricchita da una simmetria interna curata nei minimi dettagli. Il sistema Glyph si evolve, riducendosi nelle dimensioni ma aumentando l'utilità quotidiana grazie a nuove funzioni software integrate e notifiche visive. Ecco tutti i dettagli nella recensione completa
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale
Nelle ultime settimane abbiamo provato la Corsair Vanguard Air 99 Wireless, una tastiera tecnicamente da gaming, ma che in realtà offre un ampio ventaglio di possibilità anche al di fuori delle sessioni di gioco. Flessibilità e funzionalità sono le parole d'ordine di una periferica che si rivolge a chi cerca un prodotto capace di adattarsi a ogni esigenza e ogni piattaforma
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 20-08-2012, 12:23   #1
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
[C#] Parser dati pagina web

Ciao ragazzi, dovrei realizzare un programmino che data una pagina web (asp) va a recuperare alcuni valori per fare dei confronti.
Prendo per esempio questa pagina: http://www.italianbulls.com/StockList.asp
Nello specifico mi interessa leggere i dati contenuti nelle pagine di alcuni dei "Ticker" in elenco per salvarmeli in una dt ad esempio.
I valori da salvare (prendendo per esempio il primo Ticker in elenco: http://www.italianbulls.com/StockPag...er=Milan&Typ=S) sono il suo nome "A2A.MI", il suo valore attuale "0.4117" (indicato in grassetto blu in alto a dentra circa vicino al nome) e il suo valore precedente (data e prezzo) recuperato dalla prima riga della tabella "Two-Year Signal History " di destra.
Qualcuno mi saprebbe dare delle dritte? Grazie mille
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 21-08-2012, 08:15   #2
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
UP!
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 22-08-2012, 15:07   #3
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
UP
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 22-08-2012, 17:21   #4
MarcoGG
Senior Member
 
L'Avatar di MarcoGG
 
Iscritto dal: Dec 2004
Messaggi: 3210
Il risultato di quella pagina ASP produce un Document HTML e chiaramente i dati sono strutturati in una Table.
Il problema di estrapolare dati automaticamente da un flusso HTML è un classico.
In .NET una delle vie più rapide è una semplice Application Windows Forms con un controllo WebBrowser.

Sulla mia Pagina FaceBook ho inserito di recente 3 Articoli con codice funzionante sull'uso avanzato del controllo WebBrowser, con particolare attenzione al problema del parsing :

1.
https://www.facebook.com/notes/marco...66660770012070

2.
https://www.facebook.com/notes/marco...76016835743130

3.
https://www.facebook.com/notes/marco...77982925546521

La 1. in pratica è la risposta ad un quesito identico al tuo.
Il codice è VB 2010, ma portarlo in C# è molto semplice...
__________________
Contattami su FaceBook --> [ ::: MarcoGG su FaceBook ::: ]
Visita il mio Blog --> [ ::: Il Blog di MarcoGG ::: ]
MarcoGG è offline   Rispondi citando il messaggio o parte di esso
Old 20-09-2012, 09:46   #5
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Graazie mille della dritta.
Ho però un problema che mi blocca...
Dopo aver recuperato con .GetElementsByTagName("td") i vari tag,
nel ciclo successivo recuperi il valore se TDs(i).OuterHtml.Contains(testTD)
dove testID è praticamente quanto specificato nel Class del tag.
Nel mio caso all'interno del OuterHtml i tag TD non sono identificati da un Class specifico ma so che posso accedere a quello di mio interesse perchè il testo HTML specifico è:
<td height="60" valign="top"><font size="6" color="GRAY" valign="top"><b>WAIT<br></b></font></td>
Sai per caso darmi un'ulteriore dritta su come recuperare quekl tag e leggere il valore WAIT?
Grazie mille.

Quote:
Originariamente inviato da MarcoGG Guarda i messaggi
Il risultato di quella pagina ASP produce un Document HTML e chiaramente i dati sono strutturati in una Table.
Il problema di estrapolare dati automaticamente da un flusso HTML è un classico.
In .NET una delle vie più rapide è una semplice Application Windows Forms con un controllo WebBrowser.

Sulla mia Pagina FaceBook ho inserito di recente 3 Articoli con codice funzionante sull'uso avanzato del controllo WebBrowser, con particolare attenzione al problema del parsing :

1.
https://www.facebook.com/notes/marco...66660770012070

2.
https://www.facebook.com/notes/marco...76016835743130

3.
https://www.facebook.com/notes/marco...77982925546521

La 1. in pratica è la risposta ad un quesito identico al tuo.
Il codice è VB 2010, ma portarlo in C# è molto semplice...
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 20-09-2012, 09:47   #6
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Ah dimenticavo, la pagina di esempio è http://www.italianbulls.com/StockPag...er=Milan&Typ=S.
Potrebbe essere che il campo da leggere abbia un valore diverso durante la giornata...
Quote:
Originariamente inviato da teol801 Guarda i messaggi
Graazie mille della dritta.
Ho però un problema che mi blocca...
Dopo aver recuperato con .GetElementsByTagName("td") i vari tag,
nel ciclo successivo recuperi il valore se TDs(i).OuterHtml.Contains(testTD)
dove testID è praticamente quanto specificato nel Class del tag.
Nel mio caso all'interno del OuterHtml i tag TD non sono identificati da un Class specifico ma so che posso accedere a quello di mio interesse perchè il testo HTML specifico è:
<td height="60" valign="top"><font size="6" color="GRAY" valign="top"><b>WAIT<br></b></font></td>
Sai per caso darmi un'ulteriore dritta su come recuperare quekl tag e leggere il valore WAIT?
Grazie mille.
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 20-09-2012, 13:11   #7
banryu79
Senior Member
 
L'Avatar di banryu79
 
Iscritto dal: Oct 2007
Città: Padova
Messaggi: 4131
Attenzione che fare web scraping delle pagine di un sito potrebbe essere illegale.
(link)
__________________

As long as you are basically literate in programming, you should be able to express any logical relationship you understand.
If you don’t understand a logical relationship, you can use the attempt to program it as a means to learn about it.
(Chris Crawford)
banryu79 è offline   Rispondi citando il messaggio o parte di esso
Old 26-09-2012, 09:49   #8
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da teol801 Guarda i messaggi
Ciao ragazzi, dovrei realizzare un programmino che data una pagina web (asp) va a recuperare alcuni valori per fare dei confronti.
Prendo per esempio questa pagina: http://www.italianbulls.com/StockList.asp
Nello specifico mi interessa leggere i dati contenuti nelle pagine di alcuni dei "Ticker" in elenco per salvarmeli in una dt ad esempio.
I valori da salvare (prendendo per esempio il primo Ticker in elenco: http://www.italianbulls.com/StockPag...er=Milan&Typ=S) sono il suo nome "A2A.MI", il suo valore attuale "0.4117" (indicato in grassetto blu in alto a dentra circa vicino al nome) e il suo valore precedente (data e prezzo) recuperato dalla prima riga della tabella "Two-Year Signal History " di destra.
Qualcuno mi saprebbe dare delle dritte? Grazie mille
hai due soluzioni abbastanza rapide per fare quel che chiedi:

- html agility pack
- watin

dipende dalla complessità delle pagine, per quello che hai menzionato la prima soluzione è più che sufficiente

ps il sito da te citato, cos'è?
__________________
Non farò mai più affari con khalhell, 4HwGenXX.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 26-09-2012, 10:13   #9
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Grazie della risposta.
Stò provando con html agility pack ma non riesco a recuperare il valore desiderato in nessun modo. A partire dall'html recuperato provo ad accedere con xpath ma nulla.
Ho postato anche alla community del progetto cercando uno spunto.
Ti mando pm con dettagli magari tu sei più ferrato e se hai 2 minuti magari mi illumini.
Grazie mille.

Quote:
Originariamente inviato da DarkSiDE Guarda i messaggi
hai due soluzioni abbastanza rapide per fare quel che chiedi:

- html agility pack
- watin

dipende dalla complessità delle pagine, per quello che hai menzionato la prima soluzione è più che sufficiente

ps il sito da te citato, cos'è?
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 26-09-2012, 11:05   #10
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da teol801 Guarda i messaggi
Grazie della risposta.
Stò provando con html agility pack ma non riesco a recuperare il valore desiderato in nessun modo. A partire dall'html recuperato provo ad accedere con xpath ma nulla.
Ho postato anche alla community del progetto cercando uno spunto.
Ti mando pm con dettagli magari tu sei più ferrato e se hai 2 minuti magari mi illumini.
Grazie mille.
ciao,
le domande meglio farle qui, potrebbero tornare utili a qualcun altro.

Non ho capito perchè mi hai mandato il link alla community del framework che ti ho consigliato, posta il codice che lo vediamo assieme.
__________________
Non farò mai più affari con khalhell, 4HwGenXX.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 26-09-2012, 14:42   #11
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Vorrei recuperare il valore di un tag all'interno di una pagina.
Utilizzando Agility Pack sono arrivato a questo punto:

Codice:
public static HtmlDocument ParseHtml(string URL)
        {
            HtmlDocument hDoc = new HtmlDocument();
            try
            {
                WebClient wClient = new WebClient();
                byte[] bData = wClient.DownloadData(URL);
                hDoc.LoadHtml(ASCIIEncoding.ASCII.GetString(bData));
            }
            catch
            {
                hDoc.LoadHtml("");
            }
            return hDoc;
        }

HtmlAgilityPack.HtmlDocument htmldoc = ParseHtml(url);
Da questo ottengo il sorgente della pagina.
Per leggere il valore specifico tento di accedere con il metodo SelectNodes passando come argomento il percorso specifico nel sorgente con xpath (recuperato con firebug + firepath):

Codice:
HtmlNode hNode = htmldoc.DocumentNode.SelectNodes("/html/body/table/tbody/tr/td/table[5]/tbody/tr/td/table/tbody/tr/td[4]/table/tbody/tr[2]/td/table/tbody/tr/td/font")
Purtroppo però il risultato è null.

Il sorgente della pagina non è bellissimo e c'è pure un errore restituito dal parser alla riga 157 relatino ad un tag <font> non aperto.

Per l'esempio la pagina da cui leggere il dato è http://www.italianbulls.com/StockPag...er=Milan&Typ=S
Il valore da recuperare è BUY...attenzione che può cambiare nel tempo e può essere BUY-IF, SELL, SELL-IF, HOLD e cambiare di colore di conseguenza.
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 27-09-2012, 16:17   #12
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Nessun consiglio?
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 01-10-2012, 12:24   #13
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
up
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu PC Specialist Lafité 14 AI AMD: assemblat...
Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Recensione Nothing Phone 4(a): sempre iconico ma...
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale Corsair Vanguard Air 99 Wireless: non si era mai...
Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lav...
Recensione Samsung Galaxy S26 Ultra: finalmente qualcosa di nuovo Recensione Samsung Galaxy S26 Ultra: finalmente ...
Poste Italiane lancia un'Opas su TIM: la...
La crisi delle memorie potrebbe durare a...
Epic non ha alcuna intenzione di smetter...
MacBook Neo: la scommessa economica di A...
Addio elio-3? La scoperta cinese che pot...
OpenAI punta a 8.000 dipendenti entro il...
Democratici all'attacco di NVIDIA: l'acc...
Elon Musk ha annunciato TeraFab: fabbric...
Tutte le migliori offerte Amazon del wee...
Assassin's Creed: iniziate le riprese de...
TV 4K in super offerta: 75'' Mini-LED Hi...
iPad Air in offerta: 11'' con chip M3 a ...
Garmin Instinct 2X Solar Tactical a 259€...
Crimson Desert: Intel ha cercato di coll...
MacBook Air M4 da 899€ su Amazon, ma non...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 23:51.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v