Torna indietro   Hardware Upgrade Forum > Software > Programmazione

ASUS NUC 15 Pro e NUC 15 Pro+, mini PC che fondono completezza e duttilità
ASUS NUC 15 Pro e NUC 15 Pro+, mini PC che fondono completezza e duttilità
NUC 15 Pro e NUC 15 Pro+ sono i due nuovi mini-PC di casa ASUS pensati per uffici e piccole medie imprese. Compatti, potenti e pieni di porte per la massima flessibilità, le due proposte rispondono in pieno alle esigenze attuali e future grazie a una CPU con grafica integrata, accompagnata da una NPU per la gestione di alcuni compiti AI in locale.
Cybersecurity: email, utenti e agenti IA, la nuova visione di Proofpoint
Cybersecurity: email, utenti e agenti IA, la nuova visione di Proofpoint
Dal palco di Proofpoint Protect 2025 emerge la strategia per estendere la protezione dagli utenti agli agenti IA con il lancio di Satori Agents, nuove soluzioni di governance dei dati e partnership rafforzate che ridisegnano il panorama della cybersecurity
Hisense A85N: il ritorno all’OLED è convincente e alla portata di tutti
Hisense A85N: il ritorno all’OLED è convincente e alla portata di tutti
Dopo alcuni anni di assenza dai cataloghi dei suoi televisori, Hisense riporta sul mercato una proposta OLED che punta tutto sul rapporto qualità prezzo. Hisense 55A85N è un televisore completo e versatile che riesce a convincere anche senza raggiungere le vette di televisori di altra fascia (e altro prezzo)
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 20-08-2012, 11:23   #1
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
[C#] Parser dati pagina web

Ciao ragazzi, dovrei realizzare un programmino che data una pagina web (asp) va a recuperare alcuni valori per fare dei confronti.
Prendo per esempio questa pagina: http://www.italianbulls.com/StockList.asp
Nello specifico mi interessa leggere i dati contenuti nelle pagine di alcuni dei "Ticker" in elenco per salvarmeli in una dt ad esempio.
I valori da salvare (prendendo per esempio il primo Ticker in elenco: http://www.italianbulls.com/StockPag...er=Milan&Typ=S) sono il suo nome "A2A.MI", il suo valore attuale "0.4117" (indicato in grassetto blu in alto a dentra circa vicino al nome) e il suo valore precedente (data e prezzo) recuperato dalla prima riga della tabella "Two-Year Signal History " di destra.
Qualcuno mi saprebbe dare delle dritte? Grazie mille
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 21-08-2012, 07:15   #2
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
UP!
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 22-08-2012, 14:07   #3
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
UP
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 22-08-2012, 16:21   #4
MarcoGG
Senior Member
 
L'Avatar di MarcoGG
 
Iscritto dal: Dec 2004
Messaggi: 3210
Il risultato di quella pagina ASP produce un Document HTML e chiaramente i dati sono strutturati in una Table.
Il problema di estrapolare dati automaticamente da un flusso HTML è un classico.
In .NET una delle vie più rapide è una semplice Application Windows Forms con un controllo WebBrowser.

Sulla mia Pagina FaceBook ho inserito di recente 3 Articoli con codice funzionante sull'uso avanzato del controllo WebBrowser, con particolare attenzione al problema del parsing :

1.
https://www.facebook.com/notes/marco...66660770012070

2.
https://www.facebook.com/notes/marco...76016835743130

3.
https://www.facebook.com/notes/marco...77982925546521

La 1. in pratica è la risposta ad un quesito identico al tuo.
Il codice è VB 2010, ma portarlo in C# è molto semplice...
__________________
Contattami su FaceBook --> [ ::: MarcoGG su FaceBook ::: ]
Visita il mio Blog --> [ ::: Il Blog di MarcoGG ::: ]
MarcoGG è offline   Rispondi citando il messaggio o parte di esso
Old 20-09-2012, 08:46   #5
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Graazie mille della dritta.
Ho però un problema che mi blocca...
Dopo aver recuperato con .GetElementsByTagName("td") i vari tag,
nel ciclo successivo recuperi il valore se TDs(i).OuterHtml.Contains(testTD)
dove testID è praticamente quanto specificato nel Class del tag.
Nel mio caso all'interno del OuterHtml i tag TD non sono identificati da un Class specifico ma so che posso accedere a quello di mio interesse perchè il testo HTML specifico è:
<td height="60" valign="top"><font size="6" color="GRAY" valign="top"><b>WAIT<br></b></font></td>
Sai per caso darmi un'ulteriore dritta su come recuperare quekl tag e leggere il valore WAIT?
Grazie mille.

Quote:
Originariamente inviato da MarcoGG Guarda i messaggi
Il risultato di quella pagina ASP produce un Document HTML e chiaramente i dati sono strutturati in una Table.
Il problema di estrapolare dati automaticamente da un flusso HTML è un classico.
In .NET una delle vie più rapide è una semplice Application Windows Forms con un controllo WebBrowser.

Sulla mia Pagina FaceBook ho inserito di recente 3 Articoli con codice funzionante sull'uso avanzato del controllo WebBrowser, con particolare attenzione al problema del parsing :

1.
https://www.facebook.com/notes/marco...66660770012070

2.
https://www.facebook.com/notes/marco...76016835743130

3.
https://www.facebook.com/notes/marco...77982925546521

La 1. in pratica è la risposta ad un quesito identico al tuo.
Il codice è VB 2010, ma portarlo in C# è molto semplice...
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 20-09-2012, 08:47   #6
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Ah dimenticavo, la pagina di esempio è http://www.italianbulls.com/StockPag...er=Milan&Typ=S.
Potrebbe essere che il campo da leggere abbia un valore diverso durante la giornata...
Quote:
Originariamente inviato da teol801 Guarda i messaggi
Graazie mille della dritta.
Ho però un problema che mi blocca...
Dopo aver recuperato con .GetElementsByTagName("td") i vari tag,
nel ciclo successivo recuperi il valore se TDs(i).OuterHtml.Contains(testTD)
dove testID è praticamente quanto specificato nel Class del tag.
Nel mio caso all'interno del OuterHtml i tag TD non sono identificati da un Class specifico ma so che posso accedere a quello di mio interesse perchè il testo HTML specifico è:
<td height="60" valign="top"><font size="6" color="GRAY" valign="top"><b>WAIT<br></b></font></td>
Sai per caso darmi un'ulteriore dritta su come recuperare quekl tag e leggere il valore WAIT?
Grazie mille.
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 20-09-2012, 12:11   #7
banryu79
Senior Member
 
L'Avatar di banryu79
 
Iscritto dal: Oct 2007
Città: Padova
Messaggi: 4131
Attenzione che fare web scraping delle pagine di un sito potrebbe essere illegale.
(link)
__________________

As long as you are basically literate in programming, you should be able to express any logical relationship you understand.
If you don’t understand a logical relationship, you can use the attempt to program it as a means to learn about it.
(Chris Crawford)
banryu79 è offline   Rispondi citando il messaggio o parte di esso
Old 26-09-2012, 08:49   #8
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da teol801 Guarda i messaggi
Ciao ragazzi, dovrei realizzare un programmino che data una pagina web (asp) va a recuperare alcuni valori per fare dei confronti.
Prendo per esempio questa pagina: http://www.italianbulls.com/StockList.asp
Nello specifico mi interessa leggere i dati contenuti nelle pagine di alcuni dei "Ticker" in elenco per salvarmeli in una dt ad esempio.
I valori da salvare (prendendo per esempio il primo Ticker in elenco: http://www.italianbulls.com/StockPag...er=Milan&Typ=S) sono il suo nome "A2A.MI", il suo valore attuale "0.4117" (indicato in grassetto blu in alto a dentra circa vicino al nome) e il suo valore precedente (data e prezzo) recuperato dalla prima riga della tabella "Two-Year Signal History " di destra.
Qualcuno mi saprebbe dare delle dritte? Grazie mille
hai due soluzioni abbastanza rapide per fare quel che chiedi:

- html agility pack
- watin

dipende dalla complessità delle pagine, per quello che hai menzionato la prima soluzione è più che sufficiente

ps il sito da te citato, cos'è?
__________________
Non farò mai più affari con khalhell, 4HwGenXX.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 26-09-2012, 09:13   #9
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Grazie della risposta.
Stò provando con html agility pack ma non riesco a recuperare il valore desiderato in nessun modo. A partire dall'html recuperato provo ad accedere con xpath ma nulla.
Ho postato anche alla community del progetto cercando uno spunto.
Ti mando pm con dettagli magari tu sei più ferrato e se hai 2 minuti magari mi illumini.
Grazie mille.

Quote:
Originariamente inviato da DarkSiDE Guarda i messaggi
hai due soluzioni abbastanza rapide per fare quel che chiedi:

- html agility pack
- watin

dipende dalla complessità delle pagine, per quello che hai menzionato la prima soluzione è più che sufficiente

ps il sito da te citato, cos'è?
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 26-09-2012, 10:05   #10
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da teol801 Guarda i messaggi
Grazie della risposta.
Stò provando con html agility pack ma non riesco a recuperare il valore desiderato in nessun modo. A partire dall'html recuperato provo ad accedere con xpath ma nulla.
Ho postato anche alla community del progetto cercando uno spunto.
Ti mando pm con dettagli magari tu sei più ferrato e se hai 2 minuti magari mi illumini.
Grazie mille.
ciao,
le domande meglio farle qui, potrebbero tornare utili a qualcun altro.

Non ho capito perchè mi hai mandato il link alla community del framework che ti ho consigliato, posta il codice che lo vediamo assieme.
__________________
Non farò mai più affari con khalhell, 4HwGenXX.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 26-09-2012, 13:42   #11
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Vorrei recuperare il valore di un tag all'interno di una pagina.
Utilizzando Agility Pack sono arrivato a questo punto:

Codice:
public static HtmlDocument ParseHtml(string URL)
        {
            HtmlDocument hDoc = new HtmlDocument();
            try
            {
                WebClient wClient = new WebClient();
                byte[] bData = wClient.DownloadData(URL);
                hDoc.LoadHtml(ASCIIEncoding.ASCII.GetString(bData));
            }
            catch
            {
                hDoc.LoadHtml("");
            }
            return hDoc;
        }

HtmlAgilityPack.HtmlDocument htmldoc = ParseHtml(url);
Da questo ottengo il sorgente della pagina.
Per leggere il valore specifico tento di accedere con il metodo SelectNodes passando come argomento il percorso specifico nel sorgente con xpath (recuperato con firebug + firepath):

Codice:
HtmlNode hNode = htmldoc.DocumentNode.SelectNodes("/html/body/table/tbody/tr/td/table[5]/tbody/tr/td/table/tbody/tr/td[4]/table/tbody/tr[2]/td/table/tbody/tr/td/font")
Purtroppo però il risultato è null.

Il sorgente della pagina non è bellissimo e c'è pure un errore restituito dal parser alla riga 157 relatino ad un tag <font> non aperto.

Per l'esempio la pagina da cui leggere il dato è http://www.italianbulls.com/StockPag...er=Milan&Typ=S
Il valore da recuperare è BUY...attenzione che può cambiare nel tempo e può essere BUY-IF, SELL, SELL-IF, HOLD e cambiare di colore di conseguenza.
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 27-09-2012, 15:17   #12
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
Nessun consiglio?
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
Old 01-10-2012, 11:24   #13
teol801
Senior Member
 
L'Avatar di teol801
 
Iscritto dal: Dec 2004
Città: Brescia
Messaggi: 544
up
__________________
- M@']['']['eo -
teol801 è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


ASUS NUC 15 Pro e NUC 15 Pro+, mini PC che fondono completezza e duttilità ASUS NUC 15 Pro e NUC 15 Pro+, mini PC che fondo...
Cybersecurity: email, utenti e agenti IA, la nuova visione di Proofpoint Cybersecurity: email, utenti e agenti IA, la nuo...
Hisense A85N: il ritorno all’OLED è convincente e alla portata di tutti Hisense A85N: il ritorno all’OLED è convi...
Acer TravelMate P6 14 AI: il Copilot+ PC sotto il chilo per il professionista in movimento Acer TravelMate P6 14 AI: il Copilot+ PC sotto i...
Recensione Borderlands 4, tra divertimento e problemi tecnici Recensione Borderlands 4, tra divertimento e pro...
Xbox Game Pass cambia: nuovi piani e pre...
Intel produrrà chip per AMD? L'in...
Ecco il nuovo Amazon Luna: videogiochi p...
ISRO: prosegue lo sviluppo della navicel...
CoD Black Ops 7 offrirà la beta p...
Il telescopio spaziale James Webb sta ai...
Crucial spinge sui moduli LPCAMM2: fino ...
Imgur blocca gli utenti del Regno Unito:...
ROG Xbox Ally già in consegna: qu...
Ubisoft annuncia Vantage Studios: Assass...
Il solare diventa la prima fonte di elet...
Google Home si rinnova completamente: ar...
Dense Geometry Format (DGF): novit&agrav...
Gemini for Home arriva a ottobre sui dis...
Amazon Smart Air Quality Monitor: a soli...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 03:17.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v