Linux in crisi di memoria: troppa VRAM manda il pinguino nel pallone
Un problema colpisce i server AI con GPU AMD Instinct: troppa VRAM causa il fallimento dell'ibernazione su Linux. La gestione inefficiente della memoria in fase di salvataggio e ripristino porta a superare la RAM disponibile. AMD ha proposto delle patch per ottimizzare il processo e risolvere l'anomalia.
di Manolo De Agostini pubblicata il 30 Giugno 2025, alle 16:21 nel canale Sistemi OperativiLinuxAMDInstinct
L'utilizzo di acceleratori AMD Instinct di ultima generazione in ambienti server sta portando alla luce un inatteso problema nel sistema di ibernazione di Linux. Con otto GPU equipaggiate con 192 GB di memoria video ciascuna, i server AI possono arrivare a gestire oltre 1,5 TB di sola VRAM. In scenari con 2 TB di RAM di sistema, il tentativo di ibernare la macchina può fallire proprio per carenza di memoria libera.
Come riportato da Phoronix, a evidenziare la questione è stato l'ingegnere di AMD Samuel Zhang, che ha spiegato come il comportamento attuale del kernel Linux provochi, in fase di ibernazione, la duplicazione dei contenuti della VRAM nella memoria di sistema. In particolare, i dati presenti nella VRAM vengono spostati o rimossi da essa, per essere trasferiti altrove, nella GTT - Graphics Translation Table - o nella shmem - shared memory, entrambe risiedenti nella RAM, e successivamente copiata nell'immagine di ibernazione scritta su disco (swap). Questo processo può portare, nei casi peggiori, a utilizzare il doppio della memoria video presente nel sistema, arrivando così a superare la disponibilità di RAM.

Zhang ha pubblicato una serie di patch per affrontare questo limite, intervenendo sia sul gestore di alimentazione del kernel Linux sia sul driver AMDGPU. Le modifiche principali prevedono: spostamento dei dati da GTT a memoria condivisa, con successiva liberazione delle pagine GTT; scrittura forzata delle pagine condivise su disco di swap, liberando così ulteriore memoria.
Oltre al problema di esaurimento della RAM, è stato osservato che il ripristino del sistema dallo stato di ibernazione, può richiedere fino a 50 minuti a causa del caricamento dei buffer objects (BOs) dalla VRAM. Una terza patch proposta mira proprio a evitare questo passaggio, dato che le GPU non vengono utilizzate durante le fasi successive alla ripresa dell'operatività.
Sebbene molti server AI siano operativi 24/7 e raramente vengano ibernati, in alcuni contesti specifici questa funzione resta importante per contenere i consumi energetici. L'arrivo delle patch nel kernel principale non è ancora certo, ma la revisione è in corso.










Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata
Motorola edge 70: lo smartphone ultrasottile che non rinuncia a batteria e concretezza
Display, mini PC, periferiche e networking: le novità ASUS al CES 2026
Steam non si ferma più: nuovo record di utenti attivi in contemporanea
Venezuela, altro che petrolio: il tesoro segreto potrebbe chiamarsi Bitcoin
SK hynix: un nuovo impianto per produrre le memorie, ma non basterà a frenare i rincari
Facebook, cresce il furto di password con la tecnica browser-in-the-browser: ecco cosa sapere
Tesla lancia la nuova Model Y con 7 posti, solo Premium e 2.500 dollari in più
NVIDIA smentisce: nessun pagamento anticipato obbligatorio per le H200 destinate alla Cina
Il prototipo del razzo spaziale riutilizzabile Themis sarà lanciato in primavera, MaiaSpace punta a un test a fine 2026
Grok e i deepfake a sfondo sessuale, pressing su Apple e Google per la rimozione dagli store
Airbus costruirà altri 340 satelliti OneWeb per Eutelsat dedicati alla connettività Internet
Recuperare oro dai rifiuti elettronici in 20 minuti e senza veleni: la svolta arriva dalla Cina
L'FCC approva l'espansione della costellazione Starlink di SpaceX, fino a 15 mila satelliti in orbita
HBO Max è disponibile da oggi in Italia: 3 abbonamenti e pacchetto sport
Biwin al CES 2026: tra memorie e SSD compatti









2 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoGrazie per articolo.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".