PDA

View Full Version : Crash di sistema inaspettati, quasi sempre è colpa della memoria


Redazione di Hardware Upg
11-12-2015, 16:00
Link all'Articolo: http://www.hwupgrade.it/articoli/memorie/4520/crash-di-sistema-inaspettati-quasi-sempre-e-colpa-della-memoria_index.html

Gli errori della memoria DRAM sono un evento con una bassa incidenza su un singolo PC, ma in un datacenter con migliaia di macchine possono rappresentare un grave problema di affidabilità

Click sul link per visualizzare l'articolo.

demon77
11-12-2015, 16:58
Bellisimo articolo!
Un po' tosto per me ma bello! :)

+Benito+
11-12-2015, 17:28
Un dottorato utile a risparmiare qualche milione di euro l'anno

=Cipo2003=
11-12-2015, 17:42
Bellissimo articolo, complimenti!

Mparlav
11-12-2015, 18:07
Bell'articolo, l'ho letto un po' di fretta, magari approfondisco nel weekend con più calma, cercando anche nei link.

zbear
11-12-2015, 18:12
Un articolo interessante e che fa luce su certi problemi casuali e che si ripetono mai allo stesso modo anche nei pc ....

Therinai
11-12-2015, 18:35
Dopo una prima fase di perplessità, studi ed analisi approfonditi svelarono la causa: il packaging ceramico usato per la costruzione di questi chip conteneva piccole tracce di materiale radioattivo che emetteva particelle alfa capaci di compromettere i dati presenti nella memoria.

Anche se non di mio grande interesse in questo momento, non posso che apprezzare un articolo che esordisce così. Sembra fantascienza ma è roba che abbiamo sotto il naso costantemente ormai :D
Wanna moar of this :sofico:

Hal2001
11-12-2015, 18:42
Urca mi è sembrato di rileggere HwUpgrade del 2005..

igiolo
11-12-2015, 18:53
Sarebbe interessante una breve analisi sul funzionamento delle memorie ECC, quale alternativa al page retirement.

Opteranium
11-12-2015, 19:12
in un mondo dove ormai domina la linea editoriale gossippara fa piacere vedere ancora qualche bell'approfondimento tecnico. Se ne avete altri in programma, non vi peritate ;)

squalho
11-12-2015, 19:27
Mi unisco al coro di complimenti! Giusto livello di dettaglio, link per approfondire, ben scritto. Preferirei avere la meta` degli articoli con questo livello di approfondimento che non il contrario!

inkpapercafe
11-12-2015, 19:36
Chi è l'autore di questo magnifico articolo degno della vecchia scuola? Ovviamente, non "quell'altro" autore

Therinai
11-12-2015, 19:45
Urca mi è sembrato di rileggere HwUpgrade del 2005..
Non sei l'unico, basta guardare la data d'iscrizione di chi ha commentato fin'ora...

bobobyall
11-12-2015, 19:54
Non sei l'unico, basta guardare la data d'iscrizione di chi ha commentato fin'ora...

ho pensato anche io la stessa cosa! finalmente... fate anche articoli così, non solo pubblicità al nuovo telefono di turno...

Averell
11-12-2015, 20:04
Non semplicissimo per un profano ma molto interessante!

Bravi anche da parte mia :)

djfix13
11-12-2015, 20:07
se volete curiosare la qualità della vostra ram windows prevede il monitor risorse e sulla scheda memoria c'è il tasso di errore; io sul mio attuale sistema ho sempre zero mentre 2 pc fa con ram ddr2 era mediamente 2-3 errori al secondo.

Castellese
11-12-2015, 20:18
quella voce non ha nulla a che vedere con gli errori che provocano i crash

http://windows.microsoft.com/it-it/windows/what-task-manager-memory-columns-mean#1TC=windows-7

Kicco_lsd
11-12-2015, 20:54
Urca mi è sembrato di rileggere HwUpgrade del 2005..

Davvero!! Un miracolo!!!

Capozz
11-12-2015, 21:33
92 minuti di applausi (cit.) per quest'articolo. E' bello tornare a leggere qualcosa di tecnicamente approfondito dopo anni.

jonname84
11-12-2015, 21:38
non mi leggevo un articolo del genere dal 2003, anno del diploma in informatica... questo mi fa capire che sto invecchiando e qualche volta i miracoli possono accadere, (a Natale è Natale e si può fare di piùùùùùùùù) :D

Vash88
11-12-2015, 21:39
Bell'articolo! Via adblock!

Ethah
11-12-2015, 21:45
Non posto mai ma.. bell'articolo, anche per un profano come me.

davide86
11-12-2015, 22:02
Inizialmente mi aspettavo il solito articoletto ma poi mi sono dovuto ricredere. Finalmente un articolo come si deve dopo anni e anni!

Maverick18
11-12-2015, 22:20
Davvero bello l'articolo. Complimenti!!! :)

floc
12-12-2015, 00:48
ussignur cosa ci fa qui quest'articolo? Finalmente, mi unisco al coro dei complimenti.

Pero' ho un dubbio...

sebbene la maggior parte degli utenti PC attribuisca genericamente al software la colpa di eventuali crash di sistema, è invece l'hardware il principale colpevole. I datacenter del Los Alamos National Laboratory, ad esempio, mostrano come più del 60% dei fuori servizio macchina siano originati da problemi hardware.

Ecco, nei datacenter. Dove gira software che si presuppone abbia un minimo di qualita' e al di la' delle facili battute ne ha sicuramente di piu' rispetto ai pc casalinghi. Tra la mia ram e i driver della scheda tv... Mmm mi spiace ma devono presentarmi uno studio ad hoc per convincermi che la colpa e' della prima :)

Trushna
12-12-2015, 00:51
Finalmente un articolo interessante. Non commento mai, ma questa volta mi sento di fare i complimenti all'autore che ha approfondito l'argomento in modo preciso e senza annoiare.

MiKeLezZ
12-12-2015, 01:27
Ehm... basterebbe inserire un chip DRAM in più e passare dagli attuali 8/16 a 9/18... Costo per l'utente finale circa 2-3 euro e nessuna necessità di riprogrammare software o altro... Chiamasi ECC (cosa che fra l'altro ho, oramai rarità, nel mio A64 su socket obsoleto)
Perché in 20/30 anni di computing non si sia ancora adottato nel consumer per me rimane uno dei più grandi misteri dell'informatica
E sono serio

matrix83
12-12-2015, 01:43
Questo è uno dei migliori articoli mai scritti negli ultimi 10 anni su questo sito.
Questi sono gli articoli che vogliamo leggere.
Questi sono gli autori che vogliamo premiare per il loro lavoro (magari disattivando uBlock solo per i loro articoli).
Complimenti Andrea!

digieffe
12-12-2015, 02:05
finalmente la soddisfazione di un articolo fatto bene...


Ps: la ram del notebook dal quale scrivo ha una cella che periodicamente da errore, invece di cambiare il modulo di ram ho escluso la pagina dell'errore e prudenzialmente anche un paio di mega sotto ed un paio sopra

linux /boot/vmlinuz-4.2.0 root=UUID=... memmap=0x400000\$0x33800000 ro quiet splash

mike_lucca
12-12-2015, 02:56
Eheh, dopo molto tempo ho fatto anche io il login apposta per fare i complimenti.
Continuate così, sento spesso la mancanza di una rubrica tecnica e altri siti non danno soddisfazione ;-).

Yokoshima
12-12-2015, 06:40
Ottimo articolo!!!
Questi sono i contenuti che portano HWU una spanna sopra a HDBlog e simili!

Mi avete fatto tornate giovane, quando leggevo solo voi e i vostri articoli sulle architetture RISC Vs CISC.

Tornando sul tema: alla fine si tratta di fare quello che già si può fare con gli hdd escludendo i settori danneggiati.

fraussantin
12-12-2015, 08:52
Nel mio piccino ho avuto bsod per problemi sw, virus e driver con i vecchi windows.( 98 e xp)

Bsod per dischi rotti e cluster pending.
Bsod per overclock.
Ma mai avuto un banco di ram rotto.

Quindi non capisco il titolo.

Per il resto bell'articolo Domani con calma lo leggo tutto.

Axios2006
12-12-2015, 09:37
Ottimo articolo! Complimenti!

digieffe
12-12-2015, 11:29
Nel mio piccino ho avuto bsod per problemi sw, virus e driver con i vecchi windows.( 98 e xp)

Bsod per dischi rotti e cluster pending.
Bsod per overclock.
Ma mai avuto un banco di ram rotto.

Quindi non capisco il titolo.

Per il resto bell'articolo Domani con calma lo leggo tutto.

ti sei mai chiesto se non te ne sei mai accorto? :)

mi sono accorto del banco danneggiato solo a seguito del test della memoria e non avevo notato nessun crash ...

fraussantin
12-12-2015, 11:40
ti sei mai chiesto se non te ne sei mai accorto? :)

mi sono accorto del banco danneggiato solo a seguito del test della memoria e non avevo notato nessun crash ...

Se non ho bsod non testo le ram .
Quando le ho avute le ho testate e non erano quelle.

rug22
12-12-2015, 12:00
bell'articolo,spiegato bene.

Offre pochi spunti di discussione forse,ma aiuta a chiarire.

homoinformatico
12-12-2015, 13:21
Sono commosso.
Finalmente un articolo che parla (bene!) di hardware e tecnologia

Unrue
12-12-2015, 14:22
Articolo e lavoro dei ricercatori ben fatto, ma a meno che non abbia capito male, mi sembra abbastanza ovvio che se una cella di memoria è difettosa la maggior parte degli errori si manifesterà in quel punto o nell'intorno.

danieleg.dg
12-12-2015, 15:05
quella voce non ha nulla a che vedere con gli errori che provocano i crash

http://windows.microsoft.com/it-it/windows/what-task-manager-memory-columns-mean#1TC=windows-7

Lui intendeva la voce "Errori hardware" nel tab memoria del monitoraggio risorse, non nella vista dettagliata di gestione attività. Comunque anche quel dato si riferisce agli hard page fault (quello in gestione attività include anche quelli soft), non c'entra con gli errori hardware.

Mory
12-12-2015, 15:35
Se non ho bsod non testo le ram .
Quando le ho avute le ho testate e non erano quelle.

a me è capitato su svariati pc in assistenza di testare le ram più e più volte con memtest ed ogni volta avere risultati diversi :confused:

albertus82
12-12-2015, 15:45
Ehm... basterebbe inserire un chip DRAM in più e passare dagli attuali 8/16 a 9/18... Costo per l'utente finale circa 2-3 euro e nessuna necessità di riprogrammare software o altro... Chiamasi ECC (cosa che fra l'altro ho, oramai rarità, nel mio A64 su socket obsoleto)
Perché in 20/30 anni di computing non si sia ancora adottato nel consumer per me rimane uno dei più grandi misteri dell'informatica
E sono serioHai proprio ragione. E' vero che l'ECC richiede un po' di logica in più, ma non mi pare che questo possa essere un problema oggigiorno.

Queid
12-12-2015, 15:49
a me è capitato su svariati pc in assistenza di testare le ram più e più volte con memtest ed ogni volta avere risultati diversi :confused:

Io ho sempre testato la memoria con memtest86 o memtest86+ e mi hanno sempre fornito dati affidabili: tipicamente l'errore è limitato a una o più celle di memoria.

Già nel lontano 2004 avevo cercato qualcosa come il "Page retirement" su Windows, scopro solo ora con questo articolo che lo hanno implementato in Windows 7.

oliverb
12-12-2015, 17:01
Mi ricordo il mio primo computer del 99.
Aveva 64 mb di ram, poi ne aggiunsi altri 6.
Inspiegabilmente ad un certo punto windows crashava tutto, blocco totale.
Impazzivo con formattazioni, antivirus, driver, bios, niente.
Era la ram, ma nemmeno la ram, era la scheda madre che aveva qualche problema con 2 moduli insieme perchè uno alla volta andavano bene.

Therinai
12-12-2015, 18:05
Ehm... basterebbe inserire un chip DRAM in più e passare dagli attuali 8/16 a 9/18... Costo per l'utente finale circa 2-3 euro e nessuna necessità di riprogrammare software o altro... Chiamasi ECC (cosa che fra l'altro ho, oramai rarità, nel mio A64 su socket obsoleto)
Perché in 20/30 anni di computing non si sia ancora adottato nel consumer per me rimane uno dei più grandi misteri dell'informatica
E sono serio
In effetti è curiosa questa non-svolta. Al consumer hanno rifilato i 64bit che comportano una rivoluzione totale e della quale il 98% degli utenti pc casalinghi non se ne fatto nulla... cpu a 12 core... accelerazione video del software che per miracolo in ambito consumer si usa per vedere i video su youtube... ssd super veloci che manco alla nasa... ram a 8000 mhz... e poi boh, stranamente non hanno cercato di spillarci soldi con le ECC??? Vabbuòh, amen :D

walter sampei
12-12-2015, 18:36
mi unisco ai complimenti per l'articolo :)

In effetti è curiosa questa non-svolta. Al consumer hanno rifilato i 64bit che comportano una rivoluzione totale e della quale il 98% degli utenti pc casalinghi non se ne fatto nulla... cpu a 12 core... accelerazione video del software che per miracolo in ambito consumer si usa per vedere i video su youtube... ssd super veloci che manco alla nasa... ram a 8000 mhz... e poi boh, stranamente non hanno cercato di spillarci soldi con le ECC??? Vabbuòh, amen :D

a voler pensar male :D potrebbe essere perche' l'ecc potrebbe ridurre l'obsolescenza programmata.

l'utente medio usa il pc finche' va avanti, quando inizia a dar schermate blu a raffica prima prova a farlo vedere dall'amico smanettone, se gli dice che c'e' qualcosa che non va lo cambia e via. a cambiare pezzi siamo in pochi. e questo si nota anche nel passaggio da netbook (smontabili, lievemente aggiornabili e modificabili entro ovvi limiti) a tablet e 2-in-1 (impossibile farci nulla oltre a sostituire la scheda microsd).

peccato, perche' l'ecc in effetti sarebbe utile.

[K]iT[o]
12-12-2015, 18:50
Ehm... basterebbe inserire un chip DRAM in più e passare dagli attuali 8/16 a 9/18... Costo per l'utente finale circa 2-3 euro e nessuna necessità di riprogrammare software o altro... Chiamasi ECC (cosa che fra l'altro ho, oramai rarità, nel mio A64 su socket obsoleto)
Perché in 20/30 anni di computing non si sia ancora adottato nel consumer per me rimane uno dei più grandi misteri dell'informatica
E sono serio

Io non l'ho mai considerato un mistero, ma una volontà legata a non rendere utilizzabili i normali PC in ambiti più "seri" o comunque dove le elaborazioni sono molto più delicate.
Anche a me sarebbe piaciuto avere il PC con ECC per poter essere più tranquillo contro la corruzione dei dati, al momento mi accontento alla lenta verifica CRC.

lucusta
12-12-2015, 20:02
...adesso mi ritorna in mente perche' mi sono costretto per anni a fare memtest sui moduli nuovi, e quanti ne ho trovati fallati, e quanti PC ho rimesso a nuovo dopo la sostituzione di un banco ram...
purtroppo, come si diceva, nei sistemi con ram saldata, diventa praticamente impossibile intervenire in HW, e la via SF l'avevo abbandonata dai 386...
sara' il caso di seguire il consiglio e di stringere la policy di Windows Hardware Error Architecture.

Dane
13-12-2015, 00:43
Urca mi è sembrato di rileggere HwUpgrade del 2005..

+1

mi aspettavo da un momento all'altro che "spuntasse" qualche venditore di qualcosa, invece no.



Se ne fate un'altro così riabilito - ben volentieri - la pubblicità per una settimana! (ma cercate di rimanere sulla retta via)

Red Wizard
13-12-2015, 07:39
Ottimo articolo, Andrea !
Finalmente siamo tornati ai livelli che mi fecero iscrivere al forum :)

Continuate a farne così e tolgo anch'io adblock :D

[K]iT[o]
13-12-2015, 13:43
Ho cercato un po' in giro più informazioni su questo Page retirement ma non sono riuscito a capire se si può usare su memorie non ECC e quindi qualsiasi PC (da 7 in poi).

Se si potesse sbloccare su RAM e VRAM si potrebbero arginare per lungo tempo il 60% dei problemi d'usura...

greeneye
13-12-2015, 22:47
Bellissimo articolo: finalmente.

Cmq pur nella mia limitata esperienza di problemi le ram sono al secondo posto dopo gli alimentatori.

fraussantin
13-12-2015, 23:21
Bellissimo articolo: finalmente.

Cmq pur nella mia limitata esperienza di problemi le ram sono al secondo posto dopo gli alimentatori.

Secondo le.mie esperienze al primo posto ci sta il sw .

Poi gli hhd , poi le ram e poi tutto il resto.

Quanti dischi rotti in vita mia .... Quante bsod...

MiKeLezZ
14-12-2015, 00:18
Nel mio piccino ho avuto bsod per problemi sw, virus e driver con i vecchi windows.( 98 e xp)

Bsod per dischi rotti e cluster pending.
Bsod per overclock.
Ma mai avuto un banco di ram rotto.

Quindi non capisco il titolo.

Per il resto bell'articolo Domani con calma lo leggo tutto.gli errori dram sono del tipo "silent", pacifico non comprendi il titolo e il problema

sono i famosi "chissà perché ci sta mettendo più del normale per salvare", "ma perché questo programma non si chiude?", "perché non mi apre più questo file?", "che strano mi ha scaricato un file che non funziona, ma ora che l'ho riscaricato va", "dopo 4 ore che stavo giocando mi è crashato il PC", "chissà perché mi si è riavviato il PC, ieri era acceso" e via dicendo...

La correzione ECC c'è in tutta la catena informatica, dalla cache della CPU, ai dati trasmessi tramite il DMI, a quelli tramite il PCIE e pure la cache dei minicore della VGA (nel settore professionale pure la RAM della VGA)... l'unico dove misteriosamente manca sono la RAM consumer. Abbiamo dotazioni di fino 32GB in dual channel e nessun sistema di salvaguardia dell'integrità dei dati che vi transitano... Alquanto stupido eppure pure facilmente aggirabile come problema (basta 1 chip DRAM in più e grazie al doppio canale si è protetti pure per il multi-bit error oltre che il single-bit error)

http://www.intelligentmemory.com/fileadmin/download/PB_IM_ECC_DRAM.pdf

fraussantin
14-12-2015, 00:27
gli errori dram sono del tipo "silent", pacifico non comprendi il titolo e il problema

sono i famosi "chissà perché ci sta mettendo più del normale per salvare", "ma perché questo programma non si chiude?", "perché non mi apre più questo file?", "che strano mi ha scaricato un file che non funziona, ma ora che l'ho riscaricato va", "dopo 4 ore che stavo giocando mi è crashato il PC", "chissà perché mi si è riavviato il PC, ieri era acceso" e via dicendo...

La correzione ECC c'è in tutta la catena informatica, dalla cache della CPU, ai dati trasmessi tramite il DMI, a quelli tramite il PCIE e pure la cache dei minicore della VGA (nel settore professionale pure la RAM della VGA)... l'unico dove misteriosamente manca sono la RAM consumer. Abbiamo dotazioni di fino 32GB in dual channel e nessun sistema di salvaguardia dell'integrità dei dati che vi transitano... Alquanto stupido eppure pure facilmente aggirabile come problema (basta 1 chip DRAM in più e grazie al doppio canale si è protetti pure per il multi-bit error oltre che il single-bit error)

http://www.intelligentmemory.com/fileadmin/download/PB_IM_ECC_DRAM.pdf


Forse ho sbagliato a ricollegate i crash di sistema alle bsod.

Evidentemente si riferivano a eventi occulti.

Poi io parlo della mia esperienza personale , dove va anche detto che le ram sono sempre state di marca buona. ( kingstone , corsair, samsung...)

Ps i file scaricati " male " da internet mi capitano a lavoro.

Ma credevo dipemdesse dalla rete. Dici che sono le.ram? Se così gli faccio un test. ( bsod mai viste su quel pc)

emanuele83
14-12-2015, 08:46
Dopo una prima fase di perplessità, studi ed analisi approfonditi svelarono la causa: il packaging ceramico usato per la costruzione di questi chip conteneva piccole tracce di materiale radioattivo che emetteva particelle alfa capaci di compromettere i dati presenti nella memoria.

ammetto che quando ho letto decadimento alpha non volevo crederci ed ho cercato qualche fonte per capire come è andata.

Non è che tutti i chip erano affetti da errori dovuti a decadimento alpha eh... solo gli IBM. tra l'altro già nell'81 in IBM avevano tovato package contaminati da Kr85 (che però emette beta e gamma).

per chi è ineterssato ecco la storia del "Hera Problem"

1987-Radioactive contamination of a semiconductor
factory
No IBM SER historical review would be complete without
mentioning the “Hera problem.” During the year 1986,
there was an anomalous increase in LSI memory
problems. Electronics in early 1987 appeared to have
problem rates approaching 20 times higher than predicted.
In contrast, identical LSI memories being manufactured in
Europe showed no anomalous problems. Because of
knowledge of the radioactivity problem with the Intel’ 2107
RAMS [9], it was thought that the LSI package probably
was at fault, since the IBM chips were mounted on similar
ceramic materials. LSI ceramic packages made by IBM
in Europe and in the U.S. were exchanged, but the
European computer modules (with European chips and
U.S. packaging) showed no fails, while the U.S. chips
with European packages still failed at a high rate. This
indicated that the problem was undoubtedly in the USmanufactured
LSI chips. In April 1987, significant design
changes had been made to the memory chip with the most
problems, a 4Kb bipolar RAM. The newer chip had been
given the nickname Hera, and so at an early stage the
incident became known as the “Hera pr~blem.”’~
By June 1987, the problem was very serio~s.’~ A group
was organized to investigate the problem. The first
breakthrough in understanding occurred with the analysis
of “carcasses” from the memory chips (the term carcasses
refers to the chips on an LSI wafer which do not work
correctly, and are not used but saved in case some
problem occurs at a future time). Some of these
carcasses were shown to have significant radioactivity

Six weeks was spent in the manufacturing process
lines, looking for radioactivity, and traces were found
inside various processing units. However, it could not be
determined whether these traces came from the raw
materials used, or whether they were transferred from the
chips themselves, which might have been contaminated
earlier in their processing. Further, it was discovered that
radioactive filaments (containing radioactive thorium) were
commonly used in some evaporators. A detailed analysis
by T. Zabel of some of the “hot” chips revealed that the
radioactive contamination came from a single source:
Po210. This isotope is found in the uranium decay chain,
which contains about twelve different radioactive
species. The surprising fact was that Po210 was the only
contaminant on the LSI chips, and all the other expected
decay-chain elements were missing. Hundreds of chips
were analyzed for radioactivity, and Po210 contamination
was found going back more than a year. Then it was
found that whatever caused the radioactivity problem
disappeared on all wafers started after May 22, 1987.
After this precise date, all new wafers were free of
contamination (Figure lo), except for small amounts which
probably were contaminated by other older chips being
processed by the same equipment. Since it takes about
four months for chips to be manufactured, the pipeline
was still full of “hot” chips in July and August 1987.
Further sweeps of the manufacturing lines showed trace
radioactivity, but the plant was essentially clean. The
contamination had appeared in 1985, increased by more
than 1000 times until May 22, 1987, and then totally
disappeared!

Several months passed, with widespread testing of
manufacturing materials and tools, but no radioactive
contamination was discovered. All memory chips in the
manufacturing lines were spot-screened for radioactivity,
but they were clean. The radioactivity reappeared in the
manufacturing plant in early December 1987, mildly
contaminating several hundred wafers, then disappeared
again. A search of all the materials used in the fabrication
of these chips found no source of the radioactivity. With
further screening, and a lot of luck, a new and unused
bottle of nitric acid was identified by J. Hannah as
radi~active.'~ One surprising aspect of this discovery was
that, of twelve bottles in the single lot of acid, only one

was contaminated. Since all screening of materials
assumed lot-sized homogeneity, this discovery of a single
bad sample in a large lot probably explained why previous
scans of the manufacturing line had been negative. The
unopened bottle of radioactive nitric acid led investigators
back to a supplier's factory, and it was found that the
radioactivity was being injected by a bottle-cleaning
machine for semiconductor-grade acid bottles." This bottle
cleaner used radioactive Po210 material to ionize an air jet
which was used to dislodge electrostatic dust inside the
bottles after washing. The jets were leaking radioactivity

because of a change in the epoxy used to seal the Po210
inside the air jet capsule. Since these jets gave off
infrequent and random bursts of radioactivity, only
a few bottles out of thousands were contaminated.”
Once the contamination was identified and the source
pinpointed to the acid etch bottles, contaminated etch
bottles were replaced with clean bottles and the problem
completely disappeared. All Hera chips from “hot” lots
were recalled from the field and were replaced with clean
Hera chips.

fonte http://www.pld.ttu.ee/IAF0030/curtis.pdf

Chi non usa del polonio 210 nel suo processo di produzione di acido per circuiti integrati?

Simonex84
14-12-2015, 11:31
Ottimo articolo, complimenti all'autore!!

repompeo
14-12-2015, 12:48
complimenti bravi
io quando qualche banco fa le bizze metto in forno e ritona a funzionare

Benjamin Reilly
14-12-2015, 12:54
condivido, la maggior parte dei crash dipendono dalle ram e spesso i TIMINGS indicati dai produttori per esaltarne le prestazioni sono irreali, o i firmware risultano incompleti dei timings principali, oltre a considerare le limitazioni dei vari chipset da cui dipende la gestione delle memorie e nei BIOS deficitari (che i produttori di schede madri non aggiornano onde generare OBSOLESCENZA PROGRAMMATA).

Le utenze acquistano hardware il cui MARKETING esalta capacità eccellenti ma che per le ragioni citate i dispositivi NON riescono ad esprimere... limitati da hardware di installazione, chipset, software e quant'altro. (su hardware longevo o legacy un sistema operativo come Lbuntu risolve molto sfruttando adeguatamente l'accelerazione hardware (video/audio) nella fruizione multimediale permettendo fluidamente la visione di filmati HD corredati dalle moderne codifiche: esempio atto a dimostrare quanto il software sia importante a sfruttare degnamente l'HARDWARE PAGATO per svolgere le sue funzioni).

lelecarlino
14-12-2015, 14:51
se le ecc effettivamente non sono al 100% infallibili, visti i moduli di memeria ed i vari chip, non potrebbero implementare qualcosa di più efficiente quale Checksum o crc per la codifica dell'errore???!! si impatterebbe cosi tanto alle performance?? :)

Simonex84
14-12-2015, 14:54
se le ecc effettivamente non sono al 100% infallibili, visti i moduli di memeria ed i vari chip, non potrebbero implementare qualcosa di più efficiente quale Checksum o crc per la codifica dell'errore???!! si impatterebbe cosi tanto alle performance?? :)

Con un CRC puoi trovare un errore ma non puoi correggerlo, cosa che invece ECC consente, inoltre il calcolo del checksum è dispendioso, non è fattibile su una RAM

dc_gem
14-12-2015, 15:52
Ma nella pratica come faccio ad individuare le aree corrotte della ram in modo da escluderle modificando il registro di sistema? E precisamente...quale voce andrebbe modificata?...sarebbe utile una guida in proposito...

P.S. ma il tgtech??? è morto???

+Benito+
14-12-2015, 16:52
condivido, la maggior parte dei crash dipendono dalle ram e spesso i TIMINGS indicati dai produttori per esaltarne le prestazioni sono irreali, o i firmware risultano incompleti dei timings principali, oltre a considerare le limitazioni dei vari chipset da cui dipende la gestione delle memorie e nei BIOS deficitari (che i produttori di schede madri non aggiornano onde generare OBSOLESCENZA PROGRAMMATA).

Le utenze acquistano hardware il cui MARKETING esalta capacità eccellenti ma che per le ragioni citate i dispositivi NON riescono ad esprimere... limitati da hardware di installazione, chipset, software e quant'altro. (su hardware longevo o legacy un sistema operativo come Lbuntu risolve molto sfruttando adeguatamente l'accelerazione hardware (video/audio) nella fruizione multimediale permettendo fluidamente la visione di filmati HD corredati dalle moderne codifiche: esempio atto a dimostrare quanto il software sia importante a sfruttare degnamente l'HARDWARE PAGATO per svolgere le sue funzioni).


L'hardware di largo consumo non ha nè prestazioni eccezionali nè è tirato dal punto di vista delle specifiche, anzi.

MiKeLezZ
15-12-2015, 00:52
se le ecc effettivamente non sono al 100% infallibili, visti i moduli di memeria ed i vari chip, non potrebbero implementare qualcosa di più efficiente quale Checksum o crc per la codifica dell'errore???!! si impatterebbe cosi tanto alle performance?? :)Le ECC in configurazione SECDED correggono i single-bit error che sono circa il 98% di tutti i DRAM error... mentre la configurazione in dual/quad channel accoppiata ad algoritmi di tipo CHIPKILL permette di correggere anche i multi-bit error (frequenti ad esempio se una porzione di un chip DRAM è danneggiata) ed arrivare quindi a circa il 100% di errori corretti...

Unico tradeoff? Perdita di circa il 0,5% di prestazioni (considerando poi l'inutilità delle 2133MHz odierne, direi anche meno). Come costi, si tratta solo di 1 chip in più da mettere sul banco di memoria, ovvero 9 al posto di 8, quindi un aggravio di prezzo, proprio a voler esser disonesti, del 10%.

Checksum e CRC non c'entrano nulla, sono sistemi di rilevazione errori, mentre ECC è un sistema per la rilevazione e CORREZIONE errori (ECC=Error Checking and Correcting).
Il CRC si usava nei sistemi informatici antichi: se si rilevava un cheksum error nella DRAM la macchina si riavviava automaticamente, evitando quindi che potesse scrivere dati errati... Con l'ECC di oggi, invece, si ha la sicurezza che i dati siano sempre corretti e non si verifichino mai i riavvii.

http://www.cs.rochester.edu/~kshen/papers/usenix2010-li.pdf

Simonex84
15-12-2015, 08:28
Ma nella pratica come faccio ad individuare le aree corrotte della ram in modo da escluderle modificando il registro di sistema? E precisamente...quale voce andrebbe modificata?...sarebbe utile una guida in proposito...

P.S. ma il tgtech??? è morto???

Francamente non so come funzionano gli algoritmi di page retirement utilizzati nella realtà.

Però molto semplicemente l'OS, in una situazione di scarico di lavoro, potrebbe fare sei test in backgroud a rotazione su tutte le aree di memoria scrivendo un'alternanza di 0 e 1 e segnarsi quelle che rispondono male a questi stimoli mettendole in blacklist

Yokkio
15-12-2015, 11:55
Finalmente un bell'articolo che quando si è finito di leggere non porta al pensiero "caxx mi sono giocato 5 minuti di vita giù nel cesso" ma lascia soddisfatti e con il pensiero di aver imparato qualcosa.

Complimenti Andrea Bai, ti meriti una decina di click sulle pubblicità! Via ADBLOCK solo per te ;)

Kajok
15-12-2015, 14:11
oleeeeeeeeeeeeee un articolo figo!!!!

ben_wade
16-12-2015, 14:45
Noi cerchiamo articoli tecnici, quando disabilito adb e clicco sulle vostre pubblicità ( che non sono poche :P)

aspettiamo altri articoli del genere complimenti all'autore

Benjamin Reilly
16-12-2015, 15:17
a proposito di RAM esiste un thread che tratti di modifiche bios in merito onde applicare determinati accorgimenti che ne permettano l'implementazione efficace?

vorrei riuscire ad attivare il bank interleave sui 4 moduli installati. Con 2 si attiva con 4 no nonostante abilitazione da opzioni.

fraussantin
16-12-2015, 15:54
Noi cerchiamo articoli tecnici, quando disabilito adb e clicco sulle vostre pubblicità ( che non sono poche :P)

aspettiamo altri articoli del genere complimenti all'autore

Su quei banner a tendone da circo non andrebbe clikkato manco se pubblicano un articolo di Stephen Hawkin .

Io sono a favore della pubblicità , ma non deve invadere il sito . E per colpa di quei banner spesso sonori , tutti , anche il piu nabbo del mondo , sta mettendo adblock , e ilservizi come questi sono finiti in pasto ai colossi che li "costringono " a pubblicare articoli pubblicitsri.

ben_wade
16-12-2015, 16:26
Su quei banner a tendone da circo non andrebbe clikkato manco se pubblicano un articolo di Stephen Hawkin .

Io sono a favore della pubblicità , ma non deve invadere il sito . E per colpa di quei banner spesso sonori , tutti , anche il piu nabbo del mondo , sta mettendo adblock , e ilservizi come questi sono finiti in pasto ai colossi che li "costringono " a pubblicare articoli pubblicitsri.

sante parole

fracama87
07-02-2016, 02:12
da ignorante mi unisco ai complimenti per l'articolo (letto un po' in ritardo, me lo ero salvato... :D )