PDA

View Full Version : Nfrce2 memory tweak


shodan
03-10-2003, 23:42
Ciao a tutti ragazzi!
Girando un po' per la rete ho trovato questo thread che parla di alcuni esperimenti fatti per ottenere il meglio dal doppio memory controlle del chipset Nforce2.
Non si tratta di elevati incrementi, anzi sono piuttosto ridotti, però credo che la cosa possa interessare a molti di noi! :)

Ecco il link...
http://www.amdforums.com/showthread.php?threadid=237991

CIAO! :)

MiKeLezZ
04-10-2003, 07:49
Funziona anche se non si ha un chipset nforce 2

shodan
04-10-2003, 11:42
Originariamente inviato da MiKeLezZ
Funziona anche se non si ha un chipset nforce 2

Be si teoricamente dovrebbe essere applicabile a qualsiasi chipset... :)

Peach1200
04-10-2003, 12:23
...interessante... farò anch'io qlc test!!

dfruggeri
04-10-2003, 17:38
Ho fatto un pò di test con Sandra con ram impostata a 3-3-2.5 con fsb a 212 (il max per le mie povere Samsung pc2700!) cambiando solo il valore del tras di cui si parla nel thred e devo dire che il max delle prestazioni non l'ho con 11 ma con 10......ovvio che si parla sempre di miglioramenti irrisori tipo 10/15 punti nell'ALU e nell'FPU ma provare non costa nulla.
Per la cronaca con il nuovo Sandra 2004 registro 3.223/3.017!:D


ciaooooo


p.s: chi aveva letto la mia risposta prima della modifica si accorgerà subito di come sia cambiata infatti avevo scritto che effettivamente con il Tras a 11 le prestazioni erano migliori....peccato solo che dopo mi sono accorto che non era 11 ma 10!!!!:muro: :D

teoprimo
04-10-2003, 20:48
qualcuno che spiega la cosa a livello tecnico????
perchè questi miglioramente si possono solamente rilevare nei 200mhz???il numero di cicli per clock????
grazie millel!!!;)

TNR Staff
05-10-2003, 00:01
Hm..si

http://olivier.fouge.free.fr/Timing/Sandra_Float2.gif

http://olivier.fouge.free.fr/Timing/Sandra_Int2.gif

http://olivier.fouge.free.fr/Timing/PCMark_Memory.gif

Bisogna xò vedere se col salire o scendere di frequenza deve salire o scendere pure questo valore...notate l'ultimo grafico.

TNR Staff
05-10-2003, 00:05
Originariamente inviato da dfruggeri
Ho fatto un pò di test con Sandra con ram impostata a 3-3-2.5 con fsb a 212 (il max per le mie povere Samsung pc2700!) cambiando solo il valore del tras di cui si parla nel thred e devo dire che il max delle prestazioni non l'ho con 11 ma con 10......ovvio che si parla sempre di miglioramenti irrisori tipo 10/15 punti nell'ALU e nell'FPU ma provare non costa nulla.
Per la cronaca con il nuovo Sandra 2004 registro 3.223/3.017!:D


Sei in dual channel?

TNR Staff
05-10-2003, 00:17
Qui ci sono dei test,li potete trovare anke nel link di cui sopra,i valori in grassetto sono i migliori

(scusate la lunghezza)

100 MHz 2-2-2 (The varible is obviously tRAS)

2-782
3-782
4-782
5-782
6-782
7-816
8-799
9-799
10-799
11-799
12-799
13-782
14-767
15-782

133 MHz 2-2-2

2-1003
3-1003
4-1003
5-1003
6-1023
7-1065
8-1065
9-1043
10-1043
11-1043
12-1043
13-1023
14-1003
15-1003

150 MHz 2-2-2

2-1129
3-1129
4-1129
5-1129
6-1129
7-1151
8-1174
9-1174
10-1174
11-1174
12-1174
13-1151
14-1129
15-1129

166 MHz 2-2-2

2-1254
3-1254
4-1254
5-1254
6-1254
7-1279
8-1304
9-1304
10-1304
11-1304
12-1304
13-1279
14-1254
15-1254

200 MHz 2-2-2

2-1478
3-1478
4-1478
5-1478
6-1478
7-1505
8-1535
9-1535
10-1565
11-1565
12-1565
13-1535
14-1505
15-1505

Sarebbe da provare sopra i 200 mhz :wtf:

MiKeLezZ
05-10-2003, 01:42
http://www.mushkin.com/mushkin/pop-up/latencies.htm

"Memory, in many ways is like a book, you can only read after opening a book to a certain page and paragraph within that particular page. The RAS Pulse Width is the time until a page can be closed again. Therefore, just by definition, the minimum tRAS must be the RAS-to-CAS delay plus the read latency (CAS delay). That is fine for FPM and EDO memory with their single word data transfers. With SDRAM, memory controllers started to output a chain of four consecutive quadwords on every access. With DDR, that number has increased to eight quadwords that effectively are two consecutive bursts of four.

Now imagine someone closes the book you are reading from in the middle of a sentence. Right in your face! And does it over and again. This is what happens if tRAS is set too short. So here is the really simple calculation: The second burst of four has at least to be initiated and prefetched into the output buffers (like you get a glimpse at the headline in a book) before you can close the page without losing all information. That means that the minimum tRAS would be tRCD+CAS latency + 2 cycles (to output the first burst of four and make way for the second burst in the output buffers).

Any tRAS setting lower tRCD + CAS + 2 cycles will allow the memory controller to close the page “in your face!” over and again and that will cause a performance hit because of a truncated transfer that needs to be repeated. Along with those hassles comes the self-explanatory risk for data corruption. That one is not a real problem as long as the system is kept running but in case it is shut down and the memory content is written back to the hard disk drive, the consequences can be catastrophic. For the drive, that is."

So in theory running 2-2-2-5 is slower than 2-2-2-6. The ideal timings according to Mushkin works out to be:

CAS+tRCD+2 = tRAS

Examples:

2 CAS + 2 tRCD + 2 = 6 (2-2-2-6)

2 CAS + 3 tRCD + 2 = 7 (2-3-3-7)


Più chiaro di così! ;)

ByeZ. (e grazie dell'info!)

TNR Staff
05-10-2003, 02:39
Tradotto in italiano nn faceva schifo xò :D

MiKeLezZ
05-10-2003, 03:39
Originariamente inviato da MiKeLezZ
"Memory, in many ways is like a book, you can only read after opening a book to a certain page and paragraph within that particular page. The RAS Pulse Width is the time until a page can be closed again. Therefore, just by definition, the minimum tRAS must be the RAS-to-CAS delay plus the read latency (CAS delay). That is fine for FPM and EDO memory with their single word data transfers. With SDRAM, memory controllers started to output a chain of four consecutive quadwords on every access. With DDR, that number has increased to eight quadwords that effectively are two consecutive bursts of four.
La memoria in molti sensi è simile ad un libro, dopo aver aperto un libro puoi solo leggere una delle due pagine e un certo paragrafo entro quello pagina. Il RAS Pulse Width è il tempo di quanto una pagina puo' restare aperta prima che venga chiusa. Quindi, per definizione, il valore minimo di tRAS deve essere il RAS-to-CAS delay più la latenza di lettura (il CAS delay). Questo può andare bene per FPM e EDO memorie che permettono un trasferimento di dati di una singola parola per volta. Con la SDRAM, i controller di memoria hanno cominciato a elargire una catena di 4 consecutive quadriparole che, alla fin fine, sono due consecutive raffiche di quattro parole.
Now imagine someone closes the book you are reading from in the middle of a sentence. Right in your face! And does it over and again. This is what happens if tRAS is set too short. So here is the really simple calculation: The second burst of four has at least to be initiated and prefetched into the output buffers (like you get a glimpse at the headline in a book) before you can close the page without losing all information. That means that the minimum tRAS would be tRCD+CAS latency + 2 cycles (to output the first burst of four and make way for the second burst in the output buffers).
Ora immagina che qualcuno chiuda il libro che stai leggendo (ne parlavamo prima) proprio mentre sei a metà di una frase. Di botto! E lo rifà ancora e ancora. Questo è quello che succede se il tRAS è settato troppo basso. Quindi ecco qua un semplice calcolo: la seconda raffica di quattro parole deve essere almeno richiamata ed estratta dalla memoria per essere mandata alla cache della cpu prima che la pagina venga chiusa, evitando così di dover perdere tutte le informazioni (in un certo senso è come se tu dessi un'occhiata al capoverso di un libro). Questo significa che il minimo valore di tRAS dovrà essere tRCD+Cas latency + 2 cicli (per far uscire la prima raffica di quattro parole ed instradare la seconda verso la cache).
Any tRAS setting lower tRCD + CAS + 2 cycles will allow the memory controller to close the page “in your face!” over and again and that will cause a performance hit because of a truncated transfer that needs to be repeated. Along with those hassles comes the self-explanatory risk for data corruption. That one is not a real problem as long as the system is kept running but in case it is shut down and the memory content is written back to the hard disk drive, the consequences can be catastrophic. For the drive, that is."
So in theory running 2-2-2-5 is slower than 2-2-2-6. The ideal timings according to Mushkin works out to be:
CAS+tRCD+2 = tRAS

Ogni valore di tRAS minore di tRCD + CAS + 2 cicli consentirà al controller di memoria di chiudere la pagina "di botto!" ancora e ancora e questo causerà un calo di prestazioni a causa dei trasferimenti troncati che necessiteranno di essere ripetuti. Oltre a queste cose poco simpatiche c'è il rischio, che si commenta da solo, della "corruzione dati". Questo non è un grosso problema fintanto che il sistema è mantenuto in esecuzione ma nel caso in venisse spento e il contenuto della memoria dovesse esser quindi riscritto nuovamente nell'hard disk, le conseguenze potebbero essere tragiche. Per il disco, ovvio."
Quindi in teoria dei timings a 2-2-2-5 sono peggiori che a 2-2-2-6 . La configurazione ideale, seguendo i principi dettati da Mushkin, dovrebbe essere: tRAS = CAS+tRDC+2 .


E' tardi l'ho tradotto un po' a cazzuola però dovrebbe esser chiaro! Spero possa esser d'aiuto a molti di voi..
ByeZ.

dfruggeri
05-10-2003, 11:04
Originariamente inviato da TNR Staff
Sei in dual channel?


YES!....2 banchi da 256mb l'uno di Samsung pc2700!;)


ciaooo

dfruggeri
05-10-2003, 11:10
Beh se si considera ciò che dice Mushkin nel mio caso il Tras dovrei settarlo a:

3+2,5+2=7,5

Quindi o a 7 o a 8 peccato solo che avendo eseguito tutte le prove con il Tras da 5 a 15 la soluzione più performante si sia rivelata come ho già detto 10!!!:D :confused:


ciaoooo

shodan
05-10-2003, 11:59
Originariamente inviato da dfruggeri
Beh se si considera ciò che dice Mushkin nel mio caso il Tras dovrei settarlo a:

3+2,5+2=7,5

Quindi o a 7 o a 8 peccato solo che avendo eseguito tutte le prove con il Tras da 5 a 15 la soluzione più performante si sia rivelata come ho già detto 10!!!:D :confused:


ciaoooo

Be' dalle prove effettuate nel thread linkato c'è un tentativo di spiegazione anche a questo, solo che non la ricordo! :D Se non ricordo male in pratica il calcolo appena fatto deve essere corretto in funzione della frequenza di clock del bus...
Mi spiace essere così impreciso ma quel thread l'ho letto diverse settimane fa, anche se mi sono ricordato di postarlo solo ora... :D

CIAO! :)

felixmarra
05-10-2003, 18:46
non è che ci abbia capito molto :confused:

Per capirci, se le mie ram sono settate adesso con 5 2 2 2 questo non è la configurazione migliore? Dovrebbero essere settate a 6 2 2 2 ???

Ma questo indipendente dal bus?

MiKeLezZ
05-10-2003, 18:59
Originariamente inviato da felixmarra
non è che ci abbia capito molto :confused:

Per capirci, se le mie ram sono settate adesso con 5 2 2 2 questo non è la configurazione migliore? Dovrebbero essere settate a 6 2 2 2 ???

Ma questo indipendente dal bus?
So far I have concluded as a supposed fact that CAS and tRCD effect the optimal tRAS setting. I say "supposed" because I would like other people to confirm my results. Also, through the relationship between clock frequency and optimal tRAS setting, I propose the following equation for getting a range of tRAS values:

tRCD + CAS + 30ns to 40ns = Optimal tRAS (always round up)

Exemples:

For 2-2-2 @ 200 MHz
2+2+6to8= 10 to 12

For 2.5-3-3 @ 190 MHz
3+2.5+5to8= 11 to 14

For 2-2-2 @ 150 MHz
2+2+5to6= 9 to 10

For 2-2-2 @ 100 MHz
2+2+3to4= 7 to 8

felixmarra
05-10-2003, 19:07
Adesso è proprio più chiaro... :muro: come ho fatto a non arrivarci prima... :mc:

Non vorrei stressare, ma non capisco il concetto che ci sta alla base! Poi quel valore tipo "6to8" o "5to8"... ok, sono intervalli, ma da dove prendere gli estremi?

MiKeLezZ
05-10-2003, 19:15
Originariamente inviato da felixmarra
Adesso è proprio più chiaro... :muro: come ho fatto a non arrivarci prima... :mc:

Non vorrei stressare, ma non capisco il concetto che ci sta alla base! Poi quel valore tipo "6to8" o "5to8"... ok, sono intervalli, ma da dove prendere gli estremi?

I valori sono presi da questo: tRCD+CAS+(30ns to 40ns)=tRAS .

Originariamente la formula dovrebbe esser stata "tRCD+CAS+2=tRAS " ma il valore "2" è un valore finito che descrive una frazione di tempo e che quindi cambia a seconda della velocità delle RAM, aumentando con l'aumento di frequenza.

shodan
05-10-2003, 20:51
Originariamente inviato da MiKeLezZ
So far I have concluded as a supposed fact that CAS and tRCD effect the optimal tRAS setting. I say "supposed" because I would like other people to confirm my results. Also, through the relationship between clock frequency and optimal tRAS setting, I propose the following equation for getting a range of tRAS values:

tRCD + CAS + 30ns to 40ns = Optimal tRAS (always round up)

Exemples:

For 2-2-2 @ 200 MHz
2+2+6to8= 10 to 12

For 2.5-3-3 @ 190 MHz
3+2.5+5to8= 11 to 14

For 2-2-2 @ 150 MHz
2+2+5to6= 9 to 10

For 2-2-2 @ 100 MHz
2+2+3to4= 7 to 8

Ottimo! Hai preso proprio il "pezzo" a cui alludevo prima giustificando un rapporto tra i valori di tRAS e la frequnza del FSB.
Ora non resta che fare qualche prova e vedere se questa formula è corretta... ;)

CIAO! :)

Ironmaster82
05-10-2003, 21:45
Ragazzi, discussione molto interessante.... complimenti davvero!!! Adesso effettuerò un po' di prove..... potremmo raccogliere tutti i nostri dati e concludere quali effettivamente secondo noi sono i valori migliori da impostare, considerando come variabili le frequenze di funzionamento di ram, dell'FSB e il dual o single channel...... avanti al lavoro!!! :D

shodan
06-10-2003, 18:38
Originariamente inviato da Ironmaster82
Ragazzi, discussione molto interessante.... complimenti davvero!!! Adesso effettuerò un po' di prove..... potremmo raccogliere tutti i nostri dati e concludere quali effettivamente secondo noi sono i valori migliori da impostare, considerando come variabili le frequenze di funzionamento di ram, dell'FSB e il dual o single channel...... avanti al lavoro!!! :D

Infatti, appena ho 2 ore affilate libere inizio a fare tutti i test del caso... :D

CIAO! :)

dadehm
07-10-2003, 18:29
bella lì! Finalmente una "base" da cui partire.... appena riesco provo e faccio sapere

Ciao DADE

Ironmaster82
07-10-2003, 20:57
anke io appeno ho un po' di tempo mi metterò... farò i test usando sandra, aida32, super PI e il Science Mark 2..... almeno vediamo se i nostri risultati si confermano anke x ram ke montano chip diversi.... Buon lavoro a tutti! :D

Minax79
07-10-2003, 21:11
Mi pare si fosse già parlato tempo addietro di questo nel "mega-thread" sulla nf-7s. Si era concluso che probabilmente era un "errore" di Sandra (spesso ne fa ... basta vedere i bench sui dischi :rolleyes: ). Se si faceva un SuperPI da qualche mb (4 o 8) veniva fuori che il sistema era cmq più veloce con i timings al minimo.

Comunque qualche altro test non fa certo male ;)

shodan
07-10-2003, 21:13
Ecco qui, come promesso, i rusultati delle mie prove.
Il mio sistema Motherboard - CPU - RAM è il seguente:
CPU Barton 2500+ @2152Mhz (205*10.5)
2 x 256 MB DDR 400 OEM 2,5 - 2 - 3 - x (dove x va da 8 a 11 come vi spieghero sotto:))
ASUS A7N8X (Nforce 2) rev. 1.06 con BIOS ver. 1.006

Il sistema operativo è WinXP Pro, i test gli ho effettuati con Sandra 2004 (versione 2004.10.9.89 - italiano).

tRAS - Risultati alu/fpu (buffered)

8 - 2938/2734
9 - 2970/2747
10 - 2970/2746
11 - 2967/2749

Come potete vedere, se da 8 a 9 c'è un lievissimo miglioramento, da 9 a 11 i risultati sono praticamente identici. Non ho fatto i test in modalità unbuffered per mancanza di tempo, se qualcuno vuole dedicarci una mezzora (o poco più) e quindi fare i test anche in modalità unbuffered sarebbe ben accetto! :)
Sempre per mancanza di tempo non ho fatto altri benchmark, ma sinceramente penso che aumenti (o diminuizioni) così lievi siano rilevabili quasi esclusivamente utilizzando benchmark sintetici...

CIAO! :)

shodan
07-10-2003, 21:15
Originariamente inviato da Minax79
Mi pare si fosse già parlato tempo addietro di questo nel "mega-thread" sulla nf-7s. Si era concluso che probabilmente era un "errore" di Sandra (spesso ne fa ... basta vedere i bench sui dischi :rolleyes: ). Se si faceva un SuperPI da qualche mb (4 o 8) veniva fuori che il sistema era cmq più veloce con i timings al minimo.

Comunque qualche altro test non fa certo male ;)

In effetti potrebbe anche darsi... è per questo che aspetto impaziente i test di tutti! ;)

CIAO! :)

giogts
07-10-2003, 23:33
interessanate discussione:D
:sofico:

shodan
12-10-2003, 12:31
Allora ragazzi qualcun altro che fa qualche test?

CIAO! :)