Google out of space

Google out of space

Alcune voci parlano di grossi problemi per la gestione futura del "mega-database" di google

di pubblicata il , alle 09:21 nel canale Uncategorized
Google
 

Nel web si stanno diffondendo alcune voci (per la verità al momento non confermate dai diretti interessati) secondo cui Google nei prossimi anni protrebbe avere non pochi problemi nella gestione del proprio database.

I dati gestiti dal più noto motore di ricerca riguardano 4,294,967,296 pagine web ed ovviamente, visto che internet crescerà sempre, tale dato è destinato ad aumentare considerevolmente.

Le operazioni svolte da Google sul proprio db sono essenzialmente 2: aggiornamento del ranking di ogni pagina (cioè quante volte quella pagina è stata ricercata), inserimento delle nuove pagine web pubblicate dall'ultima indicizzazione (questa operazione viene costantemente effettuata dagli spider).

Le due procedure appena descritte vengono chiamate "Google dance" e richiedono circa 4 giorni di elaborazione; è lecito quindi preoccuparsi per il futuro in cui il database da aggiornare sarà enormemente più grande ed il tempo richiesto da tale update richiederà parecchio tempo.

Il rischio maggiore è relativo ad una perdita di affidabilità del motore stesso, fenomeno causato da una scarsa tempestività di aggiornamento; infatti, allungandosi i tempi per l'update del sistema, molte pagine pubblicate nel frattempo non verranno indicizzate e saranno accessibili da google parecchio tempo dopo.

Come detto in apertura, questi sono solo rumors non ancora confermati ufficialmente da Google, ma considerando l'importanza che questo motore di ricerca detiene, le informazioni trapelate possono destare qualche preoccupazione.

fonte: warp2search.com

Resta aggiornato sulle ultime offerte

Ricevi comodamente via email le segnalazioni della redazione di Hardware Upgrade sui prodotti tecnologici in offerta più interessanti per te

Quando invii il modulo, controlla la tua inbox per confermare l'iscrizione

34 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Paganetor17 Giugno 2003, 09:29 #1
vabbè, ma nel frattempo cresceranno anche le capacità del computer, no? bisognerà vedere quale dei due (crescita di internet e velocità dei PC) crescerà più in fretta...
thegiox17 Giugno 2003, 09:29 #2
probabilmente si potrebbe fare anche un pò di pulizia...del tipo siti vecchi di 5/6 anni, mai aggiornati e senza informazioni interessanti potrebbero essere non considerati nell'indicizzazione.
non so se è possibile fare una cosa del genere, però certo che i siti saranno sempre di più. pensate solamente a tutti quelli nuovi che aprono ad ogni lancio di un prodotto (film, macchine, moto, cellulari,...)
Maddoctor17 Giugno 2003, 09:33 #3

Mmmmmm

Dal mio punto di vista il problema non è tanto la crescita del DB, ma la crescita del DB in rapporto alla crescita delle prestazioni dei Server.
Non ha senso dire : Il DB cresce = perdita di affidabilità.
Chi mi vieta di pensare che Google non aggionerà i suoi server con macchine più veloci ???
Maddoctor17 Giugno 2003, 09:34 #4

Mmmmmmm (P.S.)

Ma sbaglio o ci sono in giro un pò troppi rumors su Google di questi tempi.
C'e' forse qualcuno che nutre un forte piacere nello screditare il miglior motore di ricerca del Web ????
Mainas17 Giugno 2003, 09:42 #5

stavo proprio....

...pensando la stessa cosa...
Fradetti17 Giugno 2003, 09:44 #6
Google rulez
Kazzoncrew17 Giugno 2003, 09:50 #7
Forse dico una cavolata
Ma come x esempio nei progetti di ricerca troviamo quella soluzione di più computer connessi ad un elaboratore centrale x aumentare considerevenlmente la potenza di calcolo (seti@thome), ecc
perchè google, non pensa (in un futuro) di aggiungere 1 o 2 server da supporto al suo centrale x l'elaborazione delle 2 funzioni principali?
potrebbe essere un'idea?
mila7617 Giugno 2003, 09:57 #8
Ma penso proprio ne abbiano già ben più di 2/3 di server configurati in modalità clustering. Per gestire quella roba certo non basta un server ben carrozzato
Ne avranno già a decine (se non centinaia) tutti collegati
kronos200017 Giugno 2003, 10:00 #9
Google è gestito secondo decine e decine di computer connessi fra di loro e gestiti in loco.
Tra l'altro ci fu uno scoop mesi addietro che rigurdava il rifiuto di Google dei processori Itanium, colpevoli di consumare troppo...
bottaz17 Giugno 2003, 10:04 #10
E' vero che aumenteranno le prestazioni dei server, ma di pari passo ogni volta che esce uan nuova versione del db anch'esso è sempre più pesante e lento della versione precedente, anche se ha maggiori funzioni.
Dipende da chi dei due crescerà maggiormente.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^