|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Senior Member
Iscritto dal: Mar 2007
Messaggi: 7863
|
[html/web]spider pagine/aree protette
Noto spesso che i motori di ricerca indicizzano (tenendone copia in cache liberamente accessibile)pagine appartenenti ad aree protette che richiedono credenziali di login, come avviene per le discussioni di diversi forum. Che sistema utilizzano?
|
|
|
|
|
|
#2 |
|
Member
Iscritto dal: Jan 2007
Messaggi: 189
|
per leggere il forum non c'è bisogno di essere autenticati
|
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Mar 2007
Messaggi: 7863
|
|
|
|
|
|
|
#4 |
|
Member
Iscritto dal: Jan 2007
Messaggi: 189
|
boh sinceramente non mi è mai capitato di trovare indicizzate delle pagine che richiedono il login.
tra l'altro nella guida di adsense mi pare di aver letto di non inserire gli annunci in sezioni private, perchè comunque google non ci può accedere e gli annunci contestuali non funzionerebbero di conseguenza. Per l'indicizzazione dovrebbe essere lo stesso |
|
|
|
|
|
#5 | |
|
Senior Member
Iscritto dal: Mar 2007
Messaggi: 7863
|
Quote:
|
|
|
|
|
|
|
#6 |
|
Senior Member
Iscritto dal: Nov 2006
Città: Andalo
Messaggi: 1038
|
Normalmente una pagina con login fa riferimento anche ad un DB, quindi senza pass e userid è impossibile che google riesca ad indicizzare il contenuto di una pagina PHP con dati presi da un DB... (sarebbe la scoperta del secolo)
__________________
WEB: www.botlab.it -- MOBO: X370PRO | CPU: Ryzen 1600 | VGA: GTX1070 |RAM: 16GBDDR4 | ALI: Seasonic 750w Gold | LCD: LG Flatron 24" | CASE: NZXT S340 Elite | NOTEBOOK: MacBook PRO | CELL: Iphone 11 | CONSOLE: Xbox360 | TRATTATIVE A BUON FINE: >10 |
|
|
|
|
|
#7 | |
|
Senior Member
Iscritto dal: Mar 2007
Messaggi: 7863
|
Quote:
Ovviamente non si parla di pagine personali, ma di pagine pubbliche limitate ai soli iscritti. |
|
|
|
|
|
|
#8 |
|
Senior Member
Iscritto dal: Jun 2002
Città: Dublin
Messaggi: 5989
|
Qualche esempio di queste pagine? Se una cosa simile è possibile avrò bisogno di adottare altri provvedimenti protettivi, anche se mi sembra strano.
ciao
__________________
C'ho certi cazzi Mafa' che manco tu che sei pratica li hai visti mai! |
|
|
|
|
|
#9 |
|
Senior Member
Iscritto dal: Mar 2007
Messaggi: 7863
|
http://www.google.it/search?hl=it&q=...o+civile&meta=
i primi risultati puntano ad una sezione riservata di un forum di avvocati, scegliando la copia in cache è possibile leggere tutto. La mia idea è che le pagine potessero essere state lette in un momento antecedente alla messa in protezione della pagina, ma è possibile visualizzare risultati molto recenti. |
|
|
|
|
|
#10 |
|
Senior Member
Iscritto dal: Jun 2002
Città: Dublin
Messaggi: 5989
|
Quello è normale, si vede che non hanno regolato bene i permessi. Anche io ho sotto mano un forum con phpBB 3, e si può specificare che i bot hanno accesso alle zone che altrimenti sarebbero private (quindi il forum riconosce che se è visitato da un crawler appartenente a Google, Yahoo!, etc..., può dargli pieno accesso al forum, ma se si è un utente "fisico" bisogna essere registrati e loggati). Ovviamente se è davvero privato è buono impedire anche a Google di indicizzare alcunché...
ciao
__________________
C'ho certi cazzi Mafa' che manco tu che sei pratica li hai visti mai! |
|
|
|
|
|
#11 |
|
Senior Member
Iscritto dal: Mar 2007
Messaggi: 7863
|
Non utilizzo CMS e non conoscevo questa possibilità. Quello che mi viene in mente è che utilizzino l' user-agent come discriminante, il che espone a qualche vulnerabilità.
|
|
|
|
|
|
#12 |
|
Senior Member
Iscritto dal: Jun 2002
Città: Dublin
Messaggi: 5989
|
Be', in tutta sincerità non saprei dirti tecnicamente come fanno questo "riconoscimento", non credo solo con l'user agent (non ci vuole niente a mascherarlo), ma ad ogni modo la funzionalità è disattivabile a piacimento, quindi non è un gran rischio in fin dei conti.
ciao
__________________
C'ho certi cazzi Mafa' che manco tu che sei pratica li hai visti mai! |
|
|
|
|
|
#13 |
|
Senior Member
Iscritto dal: Jul 2007
Città: Bordighera (IM)
Messaggi: 1047
|
si anche io mi ero posto la stessa domanda qualche settimana fa...
comunque (parlo da ignorante), una soluzione non sarebbe quella di impostare che se l'IP che visita la pagina appartiene a google piuttosto che a yahoo non fa visualizzare il contenuto? immagino funzioni cosi?
__________________
.:Programmatore web e Windows, WebDesigner - Portfolio:. TRATTATIVE CONCLUSE: 10 TUTTE POSITIVE! Case Corsair 240 *** CPU AMD 1700 *** MotherBoard Asus PRIME B350M *** VGA Nvidia Zotac GTX1060 6gb *** RAM Corsair 16gb DDR4 *** PSU Corsair CX650M *** SSD Samsung 850 evo 500gb *** HardDisk 1tb |
|
|
|
|
|
#14 | |
|
Senior Member
Iscritto dal: Jun 2002
Città: Dublin
Messaggi: 5989
|
Quote:
ciao
__________________
C'ho certi cazzi Mafa' che manco tu che sei pratica li hai visti mai! |
|
|
|
|
|
|
#15 | |
|
Senior Member
Iscritto dal: Jul 2007
Città: Bordighera (IM)
Messaggi: 1047
|
Quote:
__________________
.:Programmatore web e Windows, WebDesigner - Portfolio:. TRATTATIVE CONCLUSE: 10 TUTTE POSITIVE! Case Corsair 240 *** CPU AMD 1700 *** MotherBoard Asus PRIME B350M *** VGA Nvidia Zotac GTX1060 6gb *** RAM Corsair 16gb DDR4 *** PSU Corsair CX650M *** SSD Samsung 850 evo 500gb *** HardDisk 1tb |
|
|
|
|
|
|
#16 |
|
Senior Member
Iscritto dal: Mar 2007
Messaggi: 7863
|
Basarsi sull' IP non è una soluzione percorribile, perchè anche se statico, nel tempo potrebbe variare. Più percorribile quella dell' user_agent
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 11:30.




















