PDA

View Full Version : ottenere dati dai siti web


Dimitree
24-10-2013, 13:50
ciao a tutti
volevo realizzare una piccola applicazione o uno script per uso personale (per win) che mi permetta di ottenere delle info da diversi siti, nel dettaglio, vorrei inserire nell'applicazione il nome di un prodotto (cd musicale) e cercare automaticamente il relativo prezzo/disponibilità su diversi siti da me specificati in fase di programmazione. Insomma un po come funziona il sito trovaprezzi per i prodotti generici, oppure il sito rilibri per i prezzi dei libri. Tuttavia a me serve una cosa più specifica e intendo scegliere io i siti nei quali andare a cercare.
Sapete darmi qualche info su come poter fare?
conosco C, C++ e Java.
grazie a tutti

VICIUS
24-10-2013, 15:51
Se conosci java puoi cominciare con jsoup (http://jsoup.org). Dovrebbe bastare per quello che hai intenzione di fare. È piuttosto facile da usare, ha una buona documentazione e non salta per aria al primo errore presente nell'html. Se dovessi aver bisogno di qualcosa di più avanzato controlla selenium (http://docs.seleniumhq.org). Si tratta di una libreria che permette di controllare da java un browser completo come firefox o chrome. Con questa puoi veramente fare di tutto ma per usarlo serve un po' più di tempo per ingranare.

Dimitree
26-10-2013, 12:44
Grazie mille me li studio subito :-)

Tuvok-LuR-
28-10-2013, 11:49
con node.js è davvero semplice ed hai a disposizione le migliori librerie per interagire col DOM.
http://blog.miguelgrinberg.com/post/easy-web-scraping-with-nodejs

ingframin
28-10-2013, 13:28
Questo argomento interessa anche me!
Al momento ho solo controllato Mechanize e beautiful soup.
Purtroppo non girano su Python 3 :-/
Se avete qualche suggerimento specifico per Python 3 fatemi sapere :-)