PDA

View Full Version : [PHP] Non esegue il parsing su un dato sito e negli altri si...


race2
08-08-2018, 10:48
Salve,
mi si verifica una cosa insolita, sto facendo il parsing di una pagina online tramite questo script:


require_once 'simple_html_dom.php';
$html = file_get_html('https://www.olx.ro');
foreach($html->find('div') as $element) echo $element->innertext . '<br>';

Mi restituisce questo errore:

Il nostro sistema ha rilevato un problemaL'indirizzo IP che si utilizza sembra essere associato a una fonte di traffico a traffico limitato.
È anche una buona idea per una passeggiata di 10 minuti. È un problema persistente, contact-nos:
Providencia no formulário a seguinte referenência
OLX: 18.85b3f748.1533721154.4400f950

Se invece di "olx.ro" inserisco "subito.it" oppure "paginegialle.it" o altri, funzionano!!

Cosa ha OLX che impedisce di fare il parsing??

Grazie molte.

grigor91
08-08-2018, 15:40
Se provi con un semplice file_get_contents la risposta è corretta?

Secondo me è attivo un controllo per bloccare richieste da script.

Rank-1
04-09-2018, 15:55
Prova a simulare una richiesta da browser, settando gli headers ecc, aiutati con fiddler o qualche estensione per chrome/firefox.
La request puoi farla con i sockets, curl... ma sicuramente esistono classi meno grezze e più semplici da utilizzare