PDA

View Full Version : [php] Inviare form su pagina remota


race2
07-01-2017, 12:21
Salve,
tramite la classe "simple_html_dom" faccio il parser di una pagina remota per estrarre i valori di certi campi che devo poi utilizzare,
per ultimo vorrei inviare il form di informazioni che si trova nella pagina, solo che non so come fare:

$html = file_get_html('myremotepage.html');

nella variabile $html ho tutta la pagina, come posso aggangiare il form e semplicemente lanciare il submit ?

Grazie in anticipo.

les2
10-01-2017, 13:37
Ciao lo fai con CURL oppure con qualche libreria "finita".

se ho capito correttamente devi fare una post da php verso un altro server (anche che fosse il tuo poco cambia)

race2
10-01-2017, 17:01
questo è il mio codice:


$data = array('name' => 'pippo', 'email' => 'pippo@hotmail.it', 'message' => 'Ciao!!!', 'privacy' => 'true', 'token' => 'RdqRSaadPF7Pvbkg_Y4U8Jej-G9GqTZRnCgPDGVFf7s');

$options = array(
'http' => array(
'header' => "Content-type: multipart/form-data\r\n",
'method' => 'POST',
'content' => http_build_query($data)
)
);

$context = stream_context_create($options);
$result = file_get_contents($action, false, $context);


Vorrei postare il form su un altro server che non è mio.

tomminno
11-01-2017, 11:56
Non capisco quale sia il tuo problema, il codice per fare il post l'hai appena postato. Basta che la url del tuo post ($action) sia la pagina a cui vuoi inviare i dati.

Non è detto però che funzioni perchè il server magari controlla altro oltre ai meri dati del post, tipo cookie e quindi la sessione, che il tuo server non avrebbe visto che usi la file_get_contents. In tal caso dovresti usare cUrl.

race2
11-01-2017, 16:47
Non capisco quale sia il tuo problema, il codice per fare il post l'hai appena postato. Basta che la url del tuo post ($action) sia la pagina a cui vuoi inviare i dati.



Ho inserito un annuncio nel sito "subito.it", vorrei riuscire a rispondere tramite un mio script invece che tramite il form della pagina di subito.it

Cosa ho fatto fino ad ora:

ho fatto il parser della pagina,
ho estratto l'intero form di contatti,
ho salvato i campi ed i suoi valori, incluso il campo hidden dove credo ci sia la sessione ed altro,
ho fatto lo script per postare la risposta alla pagina che vuole subito.it

lo script gira ma la mail che qualcuno mi ha contattato su subito.it non mi arriva, questo significa che il server di subito.it non accetta il mio script o meglio forse non mi presento come un browser e mi rifiuta....

Cosa ne pensate, quale sarà il problema ??

tomminno
12-01-2017, 08:31
Ho inserito un annuncio nel sito "subito.it", vorrei riuscire a rispondere tramite un mio script invece che tramite il form della pagina di subito.it

Cosa ho fatto fino ad ora:

ho fatto il parser della pagina,
ho estratto l'intero form di contatti,
ho salvato i campi ed i suoi valori, incluso il campo hidden dove credo ci sia la sessione ed altro,
ho fatto lo script per postare la risposta alla pagina che vuole subito.it

lo script gira ma la mail che qualcuno mi ha contattato su subito.it non mi arriva, questo significa che il server di subito.it non accetta il mio script o meglio forse non mi presento come un browser e mi rifiuta....

Cosa ne pensate, quale sarà il problema ??

Usa cUrl invece di file_get_contents.

race2
12-01-2017, 11:46
Fatto già.
Funziona nel mio server di Aruba, su subito no !!!

E' possibile che non funziona perchè l'action del form non punta ad una pagina ma ad un indirizzo dato dall'url rewrite del sito ???

tomminno
12-01-2017, 11:58
Fatto già.
Funziona nel mio server di Aruba, su subito no !!!

E' possibile che non funziona perchè l'action del form non punta ad una pagina ma ad un indirizzo dato dall'url rewrite del sito ???

Ogni sito è diverso dall'altro, il tuo sito su Aruba magari è più semplice di quanto non sia il form su subito.
Posta il codice che hai usato. Il codice che hai pubblicato prima non usa cUrl.

les2
12-01-2017, 14:03
mi aspetto che il token del campo hidden tenga conto di un timer oltre che di un match con la sessione in modo che non si possano fare cose come questa (per vari motivi di sicurezza fra l'altro)

race2
12-01-2017, 17:34
mi aspetto che il token del campo hidden tenga conto di un timer oltre che di un match con la sessione in modo che non si possano fare cose come questa (per vari motivi di sicurezza fra l'altro)

Ma quale differenza passa se apro con un browser e rispondo oppure estraggo con un parser e rispondo ??

Quindi se tramite un browser con il solito script ma fatto in JavaScript potrebbe funzionare ??

oppure:

potrei simulare il browser tramite il componente browser in C, aprire la pagina interessata, aggiungere i valori che mi servono ai campi del form e inviare, in questo modo è un browser che fa tutto, sbaglio ???


Questo è il codice che ho usato:

Scusate mi sono accorto ora che il mio annuncio è su kijiji non su subito, vabbe poco importa questo...



<?
require_once('includes/config.php');
require_once(DOCUMENT_ROOT.'classes/simple_html_dom.php');


function getRandomUserAgent()
{
$userAgents=array(
"Mozilla/5.0 (Windows; U; Windows NT 5.1; en-GB; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6",
"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)",
"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30)",
"Opera/9.20 (Windows NT 6.0; U; en)",
"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; en) Opera 8.50",
"Mozilla/4.0 (compatible; MSIE 6.0; MSIE 5.5; Windows NT 5.1) Opera 7.02 [en]",
"Mozilla/5.0 (Macintosh; U; PPC Mac OS X Mach-O; fr; rv:1.7) Gecko/20040624 Firefox/0.9",
"Mozilla/5.0 (Macintosh; U; PPC Mac OS X; en) AppleWebKit/48 (like Gecko) Safari/48"
);
$random = rand(0,count($userAgents)-1);

return $userAgents[$random];
}



$html = file_get_html('http://www.kijiji.it/annunci/cerco-lavoro-servizi/arezzo-annunci-capolona/programmatore-client-server/107612918');
$url = 'http://www.kijiji.it'.$html->find('form#reply-form', 0)->action;


$hidden = $html->find('form#reply-form input', 4)->value;


$fields = array(
'name' => urlencode('pippo'),
'email' => urlencode('privato.2009@live.it'),
'message' => urlencode('Ciao, vorrei ricevere informazioni !!!'),
'privacy2' => urlencode('true'),
'privacy3' => urlencode('true'),
'csrf-token' => urlencode($hidden)
);

foreach($fields as $key=>$value) { $fields_string .= $key.'='.$value.'&'; }
rtrim($fields_string, '&');

$ch = curl_init();

curl_setopt($ch,CURLOPT_URL, $url);
curl_setopt($ch,CURLOPT_USERAGENT,getRandomUserAgent());
curl_setopt($ch,CURLOPT_POST, count($fields));
curl_setopt($ch,CURLOPT_POSTFIELDS, $fields_string);

$result = curl_exec($ch);

curl_close($ch);
?>

tomminno
13-01-2017, 10:37
Devi usare cUrl anche per fare la chiamata per il recupero della pagina. Usando le funzioni file_get_* ti perdi i cookie ad esempio.

race2
13-01-2017, 18:25
fino a qui ci sono, ma non funziona.

Mi date una correzione al codice in modo da farmi capire cosa necessita ancora ??


<?
require_once('includes/config.php');
require_once(DOCUMENT_ROOT.'classes/simple_html_dom.php');


$Url = 'http://www.kijiji.it/annunci/cerco-lavoro-servizi/arezzo-annunci-capolona/programmatore-client-server/107612918';


$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $Url);
curl_setopt($ch, CURLOPT_REFERER, "http://www.example.org/yay.htm");
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-GB; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_TIMEOUT, 10);

$output = curl_exec($ch);

$html = str_get_html($output);

$target_url = 'http://www.kijiji.it'.$html->find('form#reply-form', 0)->action;
$hidden = $html->find('form#reply-form input', 4)->value;

curl_close($ch);

//echo $output;

//$curl_connection = curl_init();

$post_data['name'] = 'Mario Rossi';
$post_data['email'] = 'privato.2009@live.it';
$post_data['message'] = 'Ciao, vorrei ricevere informazioni.';
$post_data['privacy2'] = 'true';
$post_data['privacy3'] = 'true';
$post_data['csrf-token'] = $hidden;

foreach ( $post_data as $key => $value)
{
$post_items[] = $key . '=' . $value;
}

$post_string = implode ('&', $post_items);

$curl_connection = curl_init($target_url);

curl_setopt($curl_connection, CURLOPT_CONNECTTIMEOUT, 30);
curl_setopt($curl_connection, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)");
curl_setopt($curl_connection, CURLOPT_RETURNTRANSFER, true);
curl_setopt($curl_connection, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl_connection, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($curl_connection, CURLOPT_POSTFIELDS, $post_string);

$result = curl_exec($curl_connection);

//print_r(curl_getinfo($curl_connection));
echo curl_errno($curl_connection).'-'.curl_error($curl_connection);

curl_close($curl_connection);
?>

race2
19-01-2017, 20:21
Ma in definitiva cosa fa un browser in più del mio script ???

tomminno
20-01-2017, 13:13
Ma in definitiva cosa fa un browser in più del mio script ???

Mi sa che ti manca la gestione dei cookie:


$cookieJar = tempnam('/tmp','cookie');
...
//Su ogni chiamata aggiungere:
curl_setopt($c, CURLOPT_COOKIEJAR, $cookieJar);


Hai verificato con il browser quali sono tutti i dati che vengono inviati? Con F12 nel tab Network vedi tutto quello che il browser invia al server. Te devi replicare esattamente quello che fa.