PDA

View Full Version : Sito hackerato, malware rimosso, ma ancora qualche problema


francanna
10-05-2017, 07:42
Ciao a tutti!
Tempo fa ho subito un attacco hacker su uno dei miei siti: in pratica hanno modificato un file core di wordpress (wp-blog-header.php) e hanno quindi creato una serie di pagine "finte" del sito (con indirizzi porno) che non risiedevano sul mio server ma apparivano come fossero (es. www.miosito.com/link-sito-porno).
Dopo molta fatica ho scoperto e risolto la vulnerabilità e queste pagine ora restituiscono tutte errore 404. Ma nel frattempo queste centinaia di pagine create sono state molto ben indicizzate da Google.
Ho provveduto a ricreare la sitemap per la Search Console e
a inserire una lista di alcune di queste pagine (quelle che facevano più traffico) nel file robots.txt con "disallow", ma a distanza di un paio di settimane vedo che ancora sono ben indicizzate e ancora creano traffico al mio sito.

DOMANDE

1) Che cos'altro posso fare per spiegare a Google che quelle pagine non esistono e non dovrebbe indicizzarle?

2) Che strumento posso utilizzare per avere un elenco completo di queste pagine?

Grazie a tutti!

zappy
10-05-2017, 08:26
Ciao a tutti!
Tempo fa ho subito un attacco hacker su uno dei miei siti: in pratica hanno modificato un file core di wordpress (wp-blog-header.php) e hanno quindi creato una serie di pagine "finte" del sito (con indirizzi porno) che non risiedevano sul mio server ma apparivano come fossero (es. www.miosito.com/link-sito-porno).
Dopo molta fatica ho scoperto e risolto la vulnerabilità e queste pagine ora restituiscono tutte errore 404. Ma nel frattempo queste centinaia di pagine create sono state molto ben indicizzate da Google.
Ho provveduto a ricreare la sitemap per la Search Console e
a inserire una lista di alcune di queste pagine (quelle che facevano più traffico) nel file robots.txt con "disallow", ma a distanza di un paio di settimane vedo che ancora sono ben indicizzate e ancora creano traffico al mio sito.

DOMANDE

1) Che cos'altro posso fare per spiegare a Google che quelle pagine non esistono e non dovrebbe indicizzarle?

2) Che strumento posso utilizzare per avere un elenco completo di queste pagine?

Grazie a tutti!
non so entrare nel merito ma penso che un sito "amatoriale" come immagino sia il tuo non viene indicizzato così spesso. probabilmente basta aspettare.

ps: hackerato perchè non era aggiornato wp? o altri motivi?

francanna
10-05-2017, 08:36
non so entrare nel merito ma penso che un sito "amatoriale" come immagino sia il tuo non viene indicizzato così spesso. probabilmente basta aspettare.

ps: hackerato perchè non era aggiornato wp? o altri motivi?

Credo che la ragione fosse qualche versione buggata di qualche plugin.
Il sito è inserito anche in Google News, l'indicizzazione delle nuove pagine è praticamente istantanea.

Non so però come fare a far "ri"indicizzare tutto, oltre ad aver caricato la nuova sitemap e dato in pasto alla search console il nuovo robots.txt con l'elenco delle pagine da non indicizzare.

Inoltre vorrei capire se esiste un tool che mi permette di scoprire quali sono gli indirizzi creati. La struttura dei miei permalink è /anno/mese/nome, mentre quelli finti sono direttamente /nome (come le pagine, per intenderci).

zappy
10-05-2017, 09:26
Credo che la ragione fosse qualche versione buggata di qualche plugin.
Il sito è inserito anche in Google News, l'indicizzazione delle nuove pagine è praticamente istantanea.
si, il problema son quelle vecchie...

Non so però come fare a far "ri"indicizzare tutto, oltre ad aver caricato la nuova sitemap e dato in pasto alla search console il nuovo robots.txt con l'elenco delle pagine da non indicizzare.mi sembra più che corretto.

Inoltre vorrei capire se esiste un tool che mi permette di scoprire quali sono gli indirizzi creati. La struttura dei miei permalink è /anno/mese/nome, mentre quelli finti sono direttamente /nome (come le pagine, per intenderci).
beh, controlla il php infetto,
cmq, se sono state ben indicizzati, vuol dire che hanno dei buoni metadati, per cui tramite lo stesso google inserendo quelle parole chiave e limitando la ricerca al tuo sito dovrebbero venire fuori, no?