|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Mar 2005
Città: trento
Messaggi: 1318
|
[Google script] Sorgente pagina sito come "ispeziona/analizza"
Salve,
dovrei "scaricare" il sorgente di una pagina web, con UrlFetchApp.fetch riesco a scaricare il sorgente html della pagina interessata, ma non riesco a vedere tutto il contenuto che vedo utilizzando il tasto destro del mouse "analizza" (con firefox... con chrome credo sia ispeziona elemento) è possibile in qualche modo accedere via script ai dati che vedo usando il comando analizza? grazie
__________________
<<giovani oggi bagnati, domani forse raffreddati....>> Papa Giovanni Paolo II - Aprile 1995 Trento Concluso positivamente con: 055, giankyfava, iceone, carocavallo |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Apr 2005
Messaggi: 3220
|
Il problema è che alcuni elementi sono modificati a runtime da altro codice presente nella pagina.
Ad esempio pensa a un comando javascript che dopo 30 secondi di permanenza aggiunge del testo.. Chiaramente non lo scaricheresti. L'unico modo che conosco è il "salva pagina" dopo averla aperta con un browser (tanto più che browser diversi danno anche risultati diversi..) |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Mar 2005
Città: trento
Messaggi: 1318
|
grazie per la risposta.
ho provato a fare "salva come html" da browser e scarica tutto il sorgente, allora ho provato a fare un wget e poi anche da google script a salvare direttamente la pagina web, ma scarica solo parzialmente. ora stavo leggendo che tramite python si dovrebbe riuscire a fare: https://www.geeksforgeeks.org/scrape...amic-websites/ vedo di continuare domani con le ricerche, ma tramite google script mi sa che posso anche lasciar perdere...
__________________
<<giovani oggi bagnati, domani forse raffreddati....>> Papa Giovanni Paolo II - Aprile 1995 Trento Concluso positivamente con: 055, giankyfava, iceone, carocavallo |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Apr 2005
Messaggi: 3220
|
Beh ovvio, l'unica soluzione è renderizzarlo con un browser e poi salvare. Altre soluzioni non ne conosco
|
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
edit
Ultima modifica di misterx : 17-02-2022 alle 16:46. |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 12:51.