PDA

View Full Version : [PHP] parsing di pagine remote con autenticazione


moGio
28-09-2007, 13:46
Ciao,

innanzitutto chiedo scusa se esiste gia' un thread come questo... in questo caso vi prego di indicarmelo; nella mia breve ricerca non ho trovato nulla.

Il mio problema e' il seguente: dal mio script php (una pagina web) ho la necessita' di recuperare informazioni che si trovano su un'altra pagina web.

E fino a qui' nessun problema.

Il problema e' che per accedere a questa pagina web contenente le mie informazioni e' necessario autenticarsi.

Faccio un esempio per spiegarmi meglio: immaginiamo di avere un account di posta elettronica da qualche parte, mettiamo su libero.

Ecco, si vuole realizzare una pagina web in php che in un angolino mi mostri anche se io abbia o meno email da leggere.

Per recuperare questa informazione, la pagina dovra' accedere al portale di libero fornendo il mio username e password, spostarsi nella sezione della posta e fare il parsing della pagina andando a recuperare se ci siano o meno dei messaggi da leggere.

Non mi interessano problemi relativi alla sicurezza.

Attualmente, fare il parsing di una pagina non e' un problema e, sempre riferendomi all'esempio, riesco ad autenticarmi al portale di libero (utente e password sono in GET e le metto nell'url della pagina di accesso) ottenendo la pagina di benvenuto successiva all'autenticazione.
Ovviamente pero', se tento ora dallo stesso script di accedere ad un'altra pagina che necessita dell'autenticazione appena effettuata, mi restituisce di nuovo la pagina di login, non riconoscendomi autenticato.

Penso che cio' accada perche' il webserver che effettua la richiesta, non conserva la sessione.
Purtroppo il webserver non e' di mia gestione e non posso modificarne le impostazioni; su questo sono presenti sia il webserever (apache) che l'interprete (php 5.x).

So che in java ci sono delle librerie open (della apache se non erro) che permettono proprio di fare questo.

Qualcuno mi sa dire se esista qualcosa anche per PHP o se esista un modo per fare cio'?

Grazie in anticipo e saluti a tutti.

maxnaldo
28-09-2007, 17:11
se hai il CURL abilitato sul php del webserver potresti provare con quello, si possono settare cookies e simulare invio di dati delle form in POST

č probabile che con le funzioni CURL si riesca a fare una cosa del genere, se invece stai usando la funzione fopen() per ottenere in get la pagina voluta non riuscirai a fare molto di pių.

qui puoi vedere alcuni esempi, tra cui anche uno che effettua il login su ebay:

http://curl.haxx.se/libcurl/php/examples/

kk3z
28-09-2007, 22:36
Perchč facendo la prima richiesta, gli header che ricevi specificano il cookie che devi creare (anche non fisicamente). Negli header della seconda richiesta devi specificare il cookie. Devi simulare un browser:

1a richiesta
Header di richiesta della pagina che includono i dati per il login
Header in risposta (contengono i dati per "creare" il cookie nell'header "Set-Cookie")

2a richiesta
Header di richiesta (devi includere i dati del cookie nell'header "Cookie")
Header in risposta insieme alla pagina

moGio
29-09-2007, 10:10
Ringrazio entrambi per le risposte.

Ho guardato gli esempi e ce n'e' uno che fa proprio al caso mio.
Purtroppo pero' sul server non ho a disposizione le CURL.

La proposta di kk3z mi pare interessante, ma per le mie attuali conoscenze di PHP la trovo dificile da capire.
Mi sembra di aver capito che devo catturare dagli header in risposta all'autenticazione le informazioni di sessione per essere riconosciuto e li devo memorizzare da qualche parte (un cookie) per poterle aggiungere alla seconda richiesta.

Ora, non pretendo lezioni private kk3z, ma se sai darmi qualche link a qualunque cosa che mi spieghi come farlo mi faresti davvero un favorone.

moGio
30-09-2007, 10:24
Non so se e' la soluzione migliore, ma ho risolto grazie a questa classe:

http://sourceforge.net/projects/snoopy/

che mi facilita entrambi i compiti: sia la richiesta di pagine web con passaggio di parametri in POST, sia il recupero degli headers della risposta che le successive chiamate con i cookies creati dagli headers ottenuti.

In pratica simula un web browser.

E' una classe del 2005 e quindi non so se vi siano approcci migliori (probabilmente si), ma mi ha permesso di fare quello che volevo con poco e semplice codice.

Non ha bisogno di nessuna libreria e basta che la versione di php sia almeno una 3.x e che sia abilitato il allow_url_fopen sul server.

Ciao

kk3z
30-09-2007, 12:43
Ottimo, la soluzione che volevo postare č un po' lunga e complessa e richiedeva l'uso dei socket per inviare e ricevere gli header. Meglio cosė. Non vedo il motivo di usare allow_url_fopen..