Overclock chip NVidia Riva TNT
In questa pagina viene illustarto come spingere al massimo il potente chipset nVidia Riva TNT; in primo piano il "problema calore" e gli aumenti prestazionali ottenibili.
di Paolo Corsini pubblicato il 12 Novembre 1998 nel canale ProcessoriNVIDIA
Overclock chip NVidia Riva TNT
Loverclock del chipset TNT è molto interessante; infatti le specifiche di nVidia prevedevano in origine una frequenza di clock per il processore ben più alta degli attuali 90-95 mhz usati nelle schede presenti sul mercato. A causa dei notevoli problemi termici la frequenza prevista di 125 mhz non è stata implementata, almeno non con lattuale processo produttivo a 0.35 micron. Le specifiche dichiaravano il TNT come il vero Voodoo2 killer, e se ciò poteva essere probabile stando alle press-release allepoca della presentazione del chip, ora che si è potuto avere tra le mani qualche implementazione con questo chipset castrato nella frequenza, si è notato che si è ben lontani dalle prestazioni di una configurazione con Voodoo2 in SLI.
La domanda a questo punto sorge spontanea:
overclockando a sufficienza il TNT è possibile dare la polvere al campione 3Dfx?
Il
Riva 128 TNT ha frequenze di lavoro separate per processore e memoria: il primo viaggia a
90 mhz, la seconda a 110mhz La Diamond
Viper V550 usata per le prove non è certo lideale per spremere le massime
prestazioni da un TNT, per due semplici motivi. Primo per via del dissipatore, abbastanza
grande per lavorare senza troppe preoccupazioni ma non certo efficiente per smaltire il
calore generato da un aumento della frequenza del 20 o 25 %. Secondo, per via della
memoria SDRAM a 8 ns e quindi accreditata di una frequenza massima di funzionamento
di 125mhz. La memoria SGRAM è molto più interessante, oltre che per le maggiorni
prestazioni, anche per le tolleranze di funzionamento ben più ampie. In attesa di una
scheda da provare che utilizzi questultimo tipo di memoria, vediamo cosa si può
cavare dalla Viper V550.
Raffreddamento
Non è stato possibile sostituire
il dissipatore, quindi si è conservato quello standard e si è piazzata una grossa
ventola in corrispondenza di esso. Unaltra ventola è stata posta dal lato opposto
della scheda video, sempre in corrispondenza del chip. Per finire, è stata aggiunta una
ventola perpendicolarmente alla scheda in modo da investire col suo flusso i chip della
memoria. Si possono trovare alcune foto nella pagina
sull'overclock del Banshee. Il sistema di raffreddamento si è rivelato abbastanza
efficace,:memoria e processore hanno conservato una temperatura accettabile durante tutti
i test. Da notare che il calore generato dal TNT (o almeno da questa scheda video)
non è il più elevato mai visto; esistono chip ben più calorosi, prima di
tutti il 3Dfx Banshee, giusto per non andare troppo indietro nel tempo. Ad esempio,
dopo lunghe sessioni di benchmark senza raffreddamento aggiuntivo, la superficie della
scheda non occupata dallelettronica non è calda al tatto, come invece succede con
le schede video che montano il Banshee.
Modalità dei test
Per portare al limite un chipset video è necessaria una CPU molto potente, si è scelto dunque un Intel Celeron Mendocino a 450 mhz per i test. Sono stati utilizzati Forsaken e Incoming per il Direct3D, Quake2 e Sin per lOpenGL. Con questultimo in particolare si è analizzato il comportamento del TNT a risoluzioni molto elevate, per evidenziare quanto un processo di overclocking possa giovare a rendere giocabili alcune risoluzioni altrimenti inutilizzabili. Si può intuire che alle basse risoluzioni un chipset video molto potente ha poco da faticare; limpegno richiesto è minore che alle alte risoluzioni e un aumento della frequenza di clock non può offrire molti benefici.
E' inoltre interessante notare come la doppia Texure Unit reagisca all'aumento della frequenza di lavoro.
Configurazione
Configurazione testata |
|
Processore |
Intel Celeron Mendocino 450 Mhz |
Motherboard |
Abit BH6 |
Ram |
1x64 mbyte SDRAM LGS PC100 GM72V66841CT7J 9815 |
Hard Disk |
I.B.M. DAQA 32160 Deskstar III |
Driver |
Powerstrip 2.28
- Driver Diamond 4.10.01.0220 |
Sistema operativo |
Windows 95 4.00.950 B |
I Risultati
Per loverclock si è utilizzato il noto Powerstrip, modificando il file PSTRIP.CFG come spiegato in questa pagina; le stringhe utilizzate nei test sono le seguenti:
Mclk=100,150,110
NVclk=85,150,90
Da Proprietà/Schermo sono stati disabilitati il Vertical sync e il software antialiasing.
E stato dapprima utilizzato Incoming per trovare separatamente i limiti di funzionamento stabili di memoria e processore.
Variazione separata del core clock (GCLK) e memory clock (MCLK): Incoming gameindex
Frequenza GCLK |
Variazione clock |
FPS 1024x768 |
Variazione FPS |
90 |
- |
47.33 |
- |
95 |
5.55% |
47.92 |
1.24% |
100 |
11.11% |
48.45 |
2.36% |
105 |
16.66% |
48.93 |
3.38% |
110 |
22.22% |
49.37 |
4.31% |
115 |
27.77% |
49.71 |
5.02% |
Frequenza MCLK |
Variazione clock |
FPS 1024x768 |
Variazione FPS |
110 |
- |
47.92 |
- |
115 |
4.54% |
48.98 |
2.21% |
120 |
9.09% |
50.76 |
5.92% |
125 |
13.63% |
52.40 |
9.34% |
130 |
18.18% |
53.69 |
12.04% |
Con la Viper V550 si è giunti a 130 mhz per la memoria e 115 mhz per il processore. Aumentando contemporaneamente ed in maniera proporzionale il clock di memoria e processore questi limiti si sono abbassati un poco, soprattuto per la memoria: non sono gradite frequenze superiore ai 125mhz. Cera da aspettarselo: la memoria di tipo SDRAM non permette di andare troppo fuori specifica, al contrario della SGRAM. Nelle prove di overclock del 3Dfx Banshee infatti con la memoria SGRAM si è giunti fino a 135 mhz senza problemi, nonostante la frequenza di default fosse uguale per entrambe le schede video, cioè 110 mhz.
Il processore più di tanto non è riuscito a dare; evidentemente se il clock è stato ridotto a 90 mhz dai previsti 125mhz ci sono stati dei validi motivi. A 118 mhz sono iniziati i primi problemi, limmagine appariva scomposta e venivano persi alcuni poligoni.
Variando contemporaneamente MCLK e GCLK, ovviamente, si ottengono le migliori prestazioni; nei test che seguono si è considerata questa modalità, partendo dalla frequenza di 95 mhz per il processore e 115 mhz per la memoria. Il sistema è andato in crash oltre i 125mhz di MCLK.
Incoming gameindex 16 bit
Frequenza |
Variazione clock |
FPS 640x480 |
Variazione FPS |
FPS 1024x768 |
Variazione FPS |
MCLK=110,GCLK=90 |
- |
107.53 |
- |
47.33 |
- |
MCLK=115,GCLK=95 |
4.54%,5.55% |
110.89 |
3.12% |
49.67 |
4.94% |
MCLK=120,GCLK=100 |
9.09%,11.11% |
112.99 |
5.07% |
52.34 |
10.58% |
MCLK=125,GCLK=105 |
13.63%,16.66% |
115.28 |
7.20% |
55.03 |
16.26% |
MCLK=125,GCLK=110 |
13.63%,22.22% |
115.28 |
7.20% |
55.68 |
17.64% |
MCLK=125,GCLK=115 |
13.63%,27.77% |
115.41 |
7.32% |
56.16 |
18.65% |
MCLK=130,GCLK=105 |
18.18%,16.66% |
crash |
- |
crash |
- |
Incoming gameindex 32 bit
Frequenza |
Variazione clock |
FPS 640x480 |
Variazione FPS |
FPS 1024x768 |
Variazione FPS |
MCLK=110,GCLK=90 |
- |
72.63 |
- |
28.72 |
- |
MCLK=115,GCLK=95 |
4.54%,5.55% |
75.96 |
4.58% |
30.16 |
5.01% |
MCLK=120,GCLK=100 |
9.09%,11.11% |
79.81 |
9.88% |
31.83 |
%10.82 |
MCLK=125,GCLK=105 |
13.63%,16.66% |
83.64 |
15.15% |
33.52 |
%16.71 |
MCLK=125,GCLK=110 |
13.63%,22.22% |
84.30 |
16.06% |
33.72 |
%17.40 |
MCLK=125,GCLK=115 |
13.63%,27.77% |
84.68 |
16.59% |
33.86 |
17.89% |
MCLK=130,GCLK=105 |
18.18%,16.66% |
crash |
- |
crash |
- |
Si è utilizzato Incoming in modalità 16 e 32 bit per notare il comportamento del TNT ad elevate profondità di colore. Come detto prima, a 640x480 a 16 bit le variazioni sono praticamente nulle. Il discorso cambia a 32 bit, dove viene evidenziato un aumento del framerate del 16% circa. A 1024x768, qualunque sia la profondità di colore utilizzata, le prestazioni aumentano in misura maggiore, restando attorno al 17-18%.
Forsaken
Frequenza |
Variazione clock |
FPS 640x480 |
Variazione FPS |
FPS 1024x768 |
Variazione FPS |
MCLK=110,GCLK=90 |
- |
178.89 |
- |
74.36 |
- |
MCLK=115,GCLK=95 |
4.54%,5.55% |
179.52 |
0.35% |
78.04 |
4.94% |
MCLK=120,GCLK=100 |
9.09%,11.11% |
182.90 |
2.24% |
82.25 |
10.61% |
MCLK=125,GCLK=105 |
13.63%,16.66% |
183.11 |
2.35% |
86.49 |
16.31% |
MCLK=125,GCLK=110 |
13.63%,22.22% |
183.89 |
2.79% |
87.23 |
17.30% |
MCLK=125,GCLK=115 |
13.63%,27.77% |
184.16 |
2.94% |
88.11 |
18.49% |
Forsaken conferma i risultati ottenuti in precedenza: nessun guadagno a 640x480, il 18% circa in più a 1024x768. C'e' da dire che questi due giochi cominciano a diventare poco indicativi per esprimere la potenza di calcolo dei processori grafici di nuova generazione, non riuscendo a sfruttare tutte le funzioni e le potenzialità di cui sono capaci.
Quake 2 640x480
Frequenza |
Variazione clock |
demo1 FPS |
Variazione FPS |
massive1 FPS |
Variazione FPS |
crusher FPS |
Variazione FPS |
MCLK=110,GCLK=90 |
- |
80.8 |
- |
64.5 |
- |
40.2 |
- |
MCLK=115,GCLK=95 |
4.54%,5.55% |
81.7 |
1.11% |
64.7 |
0.31% |
42.4 |
5.47% |
MCLK=120,GCLK=100 |
9.09%,11.11% |
83.7 |
3.58% |
65.5 |
1.55% |
42.5 |
5.72% |
MCLK=125,GCLK=105 |
13.63%,16.66% |
85.2 |
5.44% |
66.1 |
2.48% |
42 |
4.47% |
MCLK=125,GCLK=110 |
13.63%,22.22% |
85.6 |
5.94% |
66.4 |
2.94% |
41.7 |
3.73% |
MCLK=125,GCLK=115 |
13.63%,27.77% |
86.8 |
7.42% |
66.6 |
3.25% |
43.5 |
8.20% |
Quake 2 1024x768
Frequenza |
Variazione clock |
demo1 FPS |
Variazione FPS |
massive1 FPS |
Variazione FPS |
crusher FPS |
Variazione FPS |
MCLK=110,GCLK=90 |
- |
37.8 |
- |
36.5 |
- |
30.6 |
- |
MCLK=115,GCLK=95 |
4.54%,5.55% |
39.8 |
5.29% |
38.3 |
4.93% |
32.6 |
6.53% |
MCLK=120,GCLK=100 |
9.09%,11.11% |
42 |
11.11% |
40.2 |
10.13% |
33.9 |
10.78% |
MCLK=125,GCLK=105 |
13.63%,16.66% |
44.1 |
16.66% |
41.9 |
14.79% |
34.6 |
13.07% |
MCLK=125,GCLK=110 |
13.63%,22.22% |
45.2 |
19.57% |
43.1 |
18.08% |
35.6 |
16.33% |
MCLK=125,GCLK=115 |
13.63%,27.77% |
46.9 |
24.07% |
44.3 |
21.36% |
36.2 |
18.30% |
La doppia Texture Unit del Riva 128 TNT trae molti benefici dall'overclock, dimostrando di essere uno dei componenti più stressati durante una sessione di bench con giochi complessi come Quake 2. Alla risoluzione di 1024x768 abbiamo un ottimo guadagno del 24%, il più alto in assoluto emerso in queste prove. La demo crusher di Quake 2 è la più "pesante" tra le 3 utilizzate e può rappresentare il framerate minimo che può essere incontrato in una partita. Come si vede si è ben al di sopra dei 25 frame al secondo, considerati la soglia minima per giocare con sufficente fluidità.
Sin 1280x960
Frequenza |
Variazione clock |
Killer FPS |
Variazione FPS |
MCLK=110,GCLK=90 |
- |
24.6 |
- |
MCLK=115,GCLK=95 |
4.54%,5.55% |
26.3 |
6.91% |
MCLK=120,GCLK=100 |
9.09%,11.11% |
27.5 |
11.78% |
MCLK=125,GCLK=105 |
13.63%,16.66% |
28.7 |
16.66% |
MCLK=125,GCLK=110 |
13.63%,22.22% |
29.7 |
20.73% |
MCLK=125,GCLK=115 |
13.63%,27.77% |
30.2 |
22.76% |
Più aumenta la risoluzione, più l'overclock dimostra i suoi benefici. La risoluzione di 1280x960, considerata inavvicinabile fino a pochi mesi fa, diventa ora discretamente utilizzabile. In generale i giochi in OpenGL ottengono i migliori risultati con l'overclock, per via della maggiore complessità grafica di questa API, che mette a dura prova le capacità del processore video.
Conclusioni
Il Riva 128 TNT è sicuramente un processore che trae benefici da un processo di overclock, ma non quanto ci si sarebbe potuto aspettare. Prima di trarre un giudizio definitivo, bisogna notare che sostituendo il dissipatore forse si potrebbe guadagnare qualcosa in più, e sostituendo la memoria di tipo SDRAM con quella di tipo SGRAM sicuramente si sarebbero raggiunte frequenze più alte.
Si è riusciti a "killare" il campione Voodoo2? In Direct3D sicuramente; in OpenGL, o per meglio dire in Quake2, ci si è avvicinati moltissimo. Nulla da fare ancora contro una configurazione in SLI, ma questo sarebbe stato troppo chiederlo a un semplice overclock. Ma forse il TNT ha già "killato" il Voodoo2, per la qualità grafica che è capace di sfornare e per l'eccellente scheda 2D compresa nel prezzo.







Abbiamo provato Fitbit Air e Google Health: tutto sul nuovo ecosistema AI
MSI Raider A16 HX B8W: potenza AMD Ryzen e GeForce RTX 50 in un desktop replacement da 16 pollici
ASUS Zenbook A14: ora con Snapdragon X2 Elite
Proseguono i test del razzo spaziale riutilizzabile Rocket Lab Neutron per sfidare i Falcon 9 di SpaceX
La Russia starebbe monitorando il satellite ICEYE-X36, che fornisce informazioni all'Ucraina, con alcuni satelliti spia Kosmos
La Stazione Spaziale Internazionale continua a perdere atmosfera nonostante le riparazioni nel segmento russo
L'equipaggio della missione Shenzhou-23 ha raggiunto la stazione spaziale Tiangong
Arctic Freezer 36-S: nuovo dissipatore con ventola fino a 3000 rpm e costa meno di 20 euro (per ora)
Lancia Gamma svelata: prime immagini ufficiali e specifiche del nuovo crossover prodotto a Melfi
Addio allo storico NVIDIA Control Panel dopo 20 anni: la gestione della GPU si sposta su NVIDIA App
ASUS riduce le dimensioni, ma aumenta le prestazioni: ProArt GeForce RTX 5090 è un portento
Algorithmiq, leader mondiale nello sviluppo di algoritmi quantistici, si sposta a Milano
Perplexity rende pubblico Bumblebee, controlla file e programmi sospetti senza eseguirli
Lisuan LX 7G100: la GPU cinese va esaurita in poche ore. NVIDIA e AMD dovrebbero preoccuparsi?
Anche GlobalFoundries si specializzerà nella produzione di chip per i computer quantistici
Tutti i componenti hardware PC in offerta su Amazon: GeForce RTX 50, Ryzen 9000, DDR5, sedie e monitor gaming fino a 360Hz
L'Europa sfida Intel e AMD: acceso Rhea1, il processore 'sovrano' per l'AI









0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".