Libero Mail e Virgilio Mail torneranno entro 24/48 ore: ecco cosa è successo

L'adozione di una nuova tecnologia di storage, un bug del sistema operativo e le mail di Libero e Virgilio sono crollate. Italiaonline spiega cos'è successo nelle ultime ore e assicura il ritorno della posta elettronica entro le prossime 24/48 ore con "l'obiettivo primario di tutelare l'integrità dei dati".
di Manolo De Agostini pubblicata il 25 Gennaio 2023, alle 15:25 nel canale WebLiberoVirgilio
68 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDirei più per il produttore dello storage che per Libero, che ha comprato un prodotto che s'è rivelato gravemente buggato...
Vorrei proprio sapere di chi si tratta... il fatto che parlino di problemi al SO e della necessità di correggerlo "con attenzione alla salvaguardia dei dati" mi fa pensare che il filesystem o il raid (o quel che è su scala di un datacenter) di sto coso abbia totalmente perso cognizione di cosa sono i milioni di miliardi di 1 e 0 scritti nell'hw...
Se è un problema di carico di lavoro difficile provarlo sugli ambienti di test che non sono comunque dimensionati/utilizzati/utilizzabili come produzione, in questo usare un hyperscaler come fornitore dell'infrastruttura aiuta molto puoi replicare facilmente un ambiente di produzione per un tempo limitato senza spendere una follia, ma anche lì non basta perchè la quantità di dati è difficilmente riproducibile, copiare i dati di produzione, quindi email dei clienti, su un ambiente di test è da "arresto immediato" sia in Europa che in USA. Andare a simulare l'utilizzo reale di milioni di utenti su probabilmente Petabyte di dati, non è per niente agevole.
Bisognerebbe conoscere in dettaglio come funziona il loro backend, ma dubito sia un problema di "carico" e anche la storia della "canary release" non mi sembra applicabile in questo specifico caso.
Di norma le migrazioni di box storage si fanno con tool ad hoc forniti dagli stessi fornitori dei box e sono trasparenti per le applicazioni che girano sopra.
La mia ipotesi è che sia andato male qualcosa nella migrazione che ha corrotto anche i dati sorgenti e ora stiano cercando di fare il restore da un cold backup.
Di norma le migrazioni di box storage si fanno con tool ad hoc forniti dagli stessi fornitori dei box e sono trasparenti per le applicazioni che girano sopra.
La mia ipotesi è che sia andato male qualcosa nella migrazione che ha corrotto anche i dati sorgenti e ora stiano cercando di fare il restore da un cold backup.
non credo
credo che i dati siano sul nuovo storage, che abbia funzionato per X tempo, ma che ora nn funzioni come deve e stiano aspettando il fix x non fare l'anda e rianda di petabyte di roba
imho
I test purtroppo sono Test, anche se hai dati reali non sarà mai come l'ambiente di produzione.
Io però non capisco perché non abbiano creato un proxy per replicare le stesse informazioni in live sia su hw/sw vecchi e nuovi, ma facendo richieste per default a quelli nuovi.
Di norma le migrazioni di box storage si fanno con tool ad hoc forniti dagli stessi fornitori dei box e sono trasparenti per le applicazioni che girano sopra.
La mia ipotesi è che sia andato male qualcosa nella migrazione che ha corrotto anche i dati sorgenti e ora stiano cercando di fare il restore da un cold backup.
nemmeno io conosco il loro backend, ma dubito che il loro servizio mail giri su computer quantistici con supporti ottici che incidono le informazioni sul cristallo, per tanto non capisco perché non fare un proxy per gestire ambedue le infrastrutture temporanemente (mesi?) fino a quanto il sistema è collaudato.
La gente preparata esiste ancora, grazie!
credo che i dati siano sul nuovo storage, che abbia funzionato per X tempo, ma che ora nn funzioni come deve
Se fosse cosi sarei davvero curioso di conoscere la combinazione di fattori che hanno fatto si che il bug di manifestasse proprio ora. Il fatto che il problema sia partito domenica mi fa pensare a un intervento tecnico avvenuto nel weekend.
Magari non è fattibile perché hanno pezzi d'infrastruttura troppo vecchia e non se la sono sentita di correre il rischio di combinare troppi change assieme o semplicemente era troppo costoso ... Rimane cmq una bella domanda!
Di norma le migrazioni di box storage si fanno con tool ad hoc forniti dagli stessi fornitori dei box e sono trasparenti per le applicazioni che girano sopra.
La mia ipotesi è che sia andato male qualcosa nella migrazione che ha corrotto anche i dati sorgenti e ora stiano cercando di fare il restore da un cold backup.
Se stiamo ancora al rolling update stiamo freschi, l'informatica è andata avanti negli ultimi 20 anni.
I file li copi non li sposti, quindi il vecchio rimane sempre disponibile.
Mai fare rolling update, tiri su un altro server di posta basato sul nuovo storage, il vecchio lo lasci com'è, sposti solo logicamente gli utenti dal vecchio al nuovo e quando lo fai sposti anche gli ultimi dati che potrebbero non essere presenti sul nuovo storage (a seconda di quanto sono automatici i tool a disposizione potrebbero essere anche in replica perenne).
Se il nuovo non regge avrai modo di vedere se riesci a sistemare o fare il rollback degli utenti sul vecchio, riportando di conseguenza i dati dal nuovo storage al vecchio.
Magari hanno fatto lo switch proprio domenica
A maggior ragione se hai una vecchia infrastruttura non vai a romperle le scatole, tiri su uno stack tutto nuovo e migri parzialmente.
Stiamo parlando di server di posta, ci sono i file delle mail (file che non vengono più modificati una volta scritti) e poco altro dentro, mica stiamo parlando di migrare live macchine virtuali senza spegnerle...
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".