PDA

View Full Version : Wrapping informazioni siti internet..datemi un'idea..


athlon900
15-05-2008, 18:58
Ciao Ragazzi,
Devo cercare ,per la mia tesi, un modo di estrapolare informazioni (condizioni traffico,posizioni bancomat...) da siti internet e riversarli sul telefonino.
Il primo problema che mi sono posto è la fase di estrazione dei contenuti...a quanto ho capito ogni sito internet non rispetta propriamente uno standard quindi risulta impossibile creare un qualcosa in grado di estrarre informazioni da molteplici siti. L'unica soluzione potrebbe essere quella di usare lo standard xml e fare qualcosa simile al lettore rss.
Vorrei sapere quale linguaggio (tra php e java) fornisce più librerie o per lo meno qualche funzione in grado di estrapolare contenuti (immagini,testo,etc) da siti internet.

Spero di essere stato chiaro,
Aspetto un vostro aiuto o consiglio ;)

tomminno
16-05-2008, 08:46
Ciao Ragazzi,
Devo cercare ,per la mia tesi, un modo di estrapolare informazioni (condizioni traffico,posizioni bancomat...) da siti internet e riversarli sul telefonino.
Il primo problema che mi sono posto è la fase di estrazione dei contenuti...a quanto ho capito ogni sito internet non rispetta propriamente uno standard quindi risulta impossibile creare un qualcosa in grado di estrarre informazioni da molteplici siti. L'unica soluzione potrebbe essere quella di usare lo standard xml e fare qualcosa simile al lettore rss.
Vorrei sapere quale linguaggio (tra php e java) fornisce più librerie o per lo meno qualche funzione in grado di estrapolare contenuti (immagini,testo,etc) da siti internet.

Spero di essere stato chiaro,
Aspetto un vostro aiuto o consiglio ;)

Quello che serve a te è un software lato desktop quindi la scelta deve andare su Java, php ha il suo ambito di utilizzo negli applicativi web come i siti.

Comunque l'estrapolazione di informazioni dettagliate da fonti eterogenee come i siti non è certo una impresa semplice.

athlon900
16-05-2008, 10:30
Comunque l'estrapolazione di informazioni dettagliate da fonti eterogenee come i siti non è certo una impresa semplice.

esatto è quello che dico io :muro: non essendoci uno standard si può creare (forse) qualcosa ad hoc per il sito ma basterebbe un cambio di una virgola per renderlo inutilizzabile..

dovrei estrarre informazioni da questo sito:

http://faro.pattichiari.it/

in pratica dovrei prendere informazioni relative ai bancomat a seconda della posizione (che mi viene data da un gps..questa parte è stata già implementata)

consigli?