PDA

View Full Version : nVidia GeForce 6800 - Thread Ufficiale


Pagine : 1 2 3 4 5 6 7 8 9 [10] 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Gatz1980
26-04-2004, 12:09
Ricapitolando:

1) Gli SM3.0 introducono vantaggi dal punto di vista della semplicità di sviluppo, ma quasi nulla nella qualità, a parte il fatto di utilizzare precisione a 32bit, laddove sia richiesto.

2) Le DX9.0c supporteranno questo nuovo linguaggio per programmare gli shader, il quale verrà compilato in istruzioni 2.0 o 3.0 a seconda dell'hardware sul quale verrà eseguito. In questo modo presumibilmente le FX6800 avranno dei vantaggi in termini di prestazioni rispetto ad un'architettura 2.0.

3) I famosi screen di FarCry sono stati fatti "in casa" usando addirittura delle DX in versione beta, perciò per fare dei veri confronti qualitativi ad esempio su 3DMark2003 o FarCry (mi riferisco alla recente discussione fp16/fp32, dove sembrava che le 9800 avessero una qualità superiore) bisognerà aspettare sia questa nuova release delle DirectX, sia i nuovi Forceware ufficiali.

Spero che la mia sia la giusta chiave di lettura, altrimenti esorto chiunque sia più esperto di me a correggermi :p

Dark Schneider
26-04-2004, 13:53
Gatz i ps 3.0 si semplificano parecchio le cose al programmatore, ci sono delle migliorie, ma appunto nulla che non si possono fare con i ps 2.0!! I VS 3.0 invece introducono alcune cosette nuove rispetto ai 2.0 oltre che a semplificar le caratteristicge già esistenti!!

Cmq più che altro è il tempo per sfruttare gli shader 3.0 la vera incognita, perchè sennò sono una bella cosa. Alla fine i programmatori sono più facilitati e noi utenti avvantaggiati. Ma il tempo ci vuole purtroppo.

Cmq è interessante sapere che entro il 4 Luglio la disponibilità sarà alta...con le lisce incluse. Usciranno in giugno..ma entro il 4 Luglio sarà elevata la quantità dell'intera gamma. Interessante che la liscia...ci sarà anche a 256 MB se qlc produttore vorrà farla da 256 MB. Mi chiedo però il prezzo.

halduemilauno
26-04-2004, 14:01
Originariamente inviato da Dark Schneider
Gatz i ps 3.0 si semplificano parecchio le cose al programmatore, ci sono delle migliorie, ma appunto nulla che non si possono fare con i ps 2.0!! I VS 3.0 invece introducono alcune cosette nuove rispetto ai 2.0 oltre che a semplificar le caratteristicge già esistenti!!

Cmq più che altro è il tempo per sfruttare gli shader 3.0 la vera incognita, perchè sennò sono una bella cosa. Alla fine i programmatori sono più facilitati e noi utenti avvantaggiati. Ma il tempo ci vuole purtroppo.

Cmq è interessante sapere che entro il 4 Luglio la disponibilità sarà alta...con le lisce incluse. Usciranno in giugno..ma entro il 4 Luglio sarà elevata la quantità dell'intera gamma. Interessante che la liscia...ci sarà anche a 256 MB se qlc produttore vorrà farla da 256 MB. Mi chiedo però il prezzo.


per la faccenda del 4 luglio è da ricordare cosa accadde l'altr'anno negli usa la 5900 usci proprio il 4 luglio in concomitanza con la loro festa nazionale. mentre in Europa ed Asia la scheda era gia disponibile da una mesata.
il prezzo della liscia a 256 pare 329$. da noi probabile sui 399€.
ciao.
:) :)

Dark Schneider
26-04-2004, 14:11
Originariamente inviato da halduemilauno
per la faccenda del 4 luglio è da ricordare cosa accadde l'altr'anno negli usa la 5900 usci proprio il 4 luglio in concomitanza con la loro festa nazionale. mentre in Europa ed Asia la scheda era gia disponibile da una mesata.
il prezzo della liscia a 256 pare 329$. da noi probabile sui 399€.
ciao.
:) :)


Incredibile,eh? Qlc volta siamo più fortunati noi che gli Usa.!! :)

lelef81
26-04-2004, 14:24
Originariamente inviato da Dark Schneider
Incredibile,eh? Qlc volta siamo più fortunati noi che gli Usa.!! :)
se pagarla 100 € in + ti pare fortuna.....:eek: :eek:

JENA PLISSKEN
26-04-2004, 14:25
Originariamente inviato da Dark Schneider
Gatz i ps 3.0 si semplificano parecchio le cose al programmatore, ci sono delle migliorie, ma appunto nulla che non si possono fare con i ps 2.0!! I VS 3.0 invece introducono alcune cosette nuove rispetto ai 2.0 oltre che a semplificar le caratteristicge già esistenti!!

Cmq più che altro è il tempo per sfruttare gli shader 3.0 la vera incognita, perchè sennò sono una bella cosa. Alla fine i programmatori sono più facilitati e noi utenti avvantaggiati. Ma il tempo ci vuole purtroppo.

.

Si...è così...ottimo sunto:oink:

halduemilauno
26-04-2004, 14:30
Originariamente inviato da lelef81
se pagarla 100 € in + ti pare fortuna.....:eek: :eek:


si riferiva al fatto di averla prima. e poi da noi c'è l'IVA e azzi e mazzi da aggiungere.
;)

lelef81
26-04-2004, 14:33
Originariamente inviato da halduemilauno
si riferiva al fatto di averla prima. e poi da noi c'è l'IVA e azzi e mazzi da aggiungere.
;)
avevo capito, ma non mi pare fortuna averla prima e pagarla una pacca di soldi in +
va bene l'iva, ma gli "azzi e mazzi " da dove cavolo saltano fuori?

JENA PLISSKEN
26-04-2004, 14:43
Originariamente inviato da lelef81
avevo capito, ma non mi pare fortuna averla prima e pagarla una pacca di soldi in +
va bene l'iva, ma gli "azzi e mazzi " da dove cavolo saltano fuori?

Chiediti xchè la genete si organizza x comprare in gruppo dalla Francia o INGHILTERRA etc:rolleyes: :rolleyes: :rolleyes:

halduemilauno
26-04-2004, 14:46
Originariamente inviato da lelef81
avevo capito, ma non mi pare fortuna averla prima e pagarla una pacca di soldi in +
va bene l'iva, ma gli "azzi e mazzi " da dove cavolo saltano fuori?


ma quello è il prezzo standard per una scheda di quella fascia appena uscita.
:) :)

lelef81
26-04-2004, 14:50
Originariamente inviato da JENA PLISSKEN
Chiediti xchè la genete si organizza x comprare in gruppo dalla Francia o INGHILTERRA etc:rolleyes: :rolleyes: :rolleyes:
sono anch'io uno di quelli....

Dark Schneider
26-04-2004, 14:54
Cmq l'iva va applicata non al prezzo al dollaro...ma a quanto vale in euro. Per la serie: 499 dollari non è 499 euro + iva.

Sawato Onizuka
26-04-2004, 16:25
Originariamente inviato da JENA PLISSKEN
Chiediti xchè la genete si organizza x comprare in gruppo dalla Francia o INGHILTERRA etc:rolleyes: :rolleyes: :rolleyes:

ah be' da quanto mi son registrato su ebay ho su una epox e un aopen comprate in germania più le ram comprate in UK ... nonostante tutto anche con SS nn ho speso più che da noi :sofico: ;)

bombardax
26-04-2004, 16:29
Originariamente inviato da Sawato Onizuka
ah be' da quanto mi son registrato su ebay ho su una epox e un aopen comprate in germania più le ram comprate in UK ... nonostante tutto anche con SS nn ho speso più che da noi :sofico: ;)


quotissimo...
aspetto in giga di Corsair dalla Califoggia:D

Dark Schneider
26-04-2004, 17:01
Originariamente inviato da Sawato Onizuka
ah be' da quanto mi son registrato su ebay ho su una epox e un aopen comprate in germania più le ram comprate in UK ... nonostante tutto anche con SS nn ho speso più che da noi :sofico: ;)

Si ma ad esempio? Tipo na scheda che costa un equivalente di 200 euro in sterline.....con le spese quanto verrebbe?

halduemilauno
26-04-2004, 18:39
http://news.hwupgrade.it/12304.html
Al debutto della nuova famiglia di schede video GeForce 6800, NVIDIA ha annunciato la prossima disponibilità di due prodotti. La prima scheda è il modello top della gamma, contrassegnato dalla sigla Ultra e venduto ad un prezzo ufficiale di 499 dollari. La seconda, invece, è il modello "entry level" della famiglia NV40, con prezzo indicativo di 299 dollari.

Emergono ora dettagli di una nuova versione di scheda NV40, posta a metà strada tra i due modelli annunciati ufficialmente. Il nome di questa soluzione dovrebbe essere GeForce 6800 PRO, per caratteristiche prestazionali molto vicina alla soluzione Ultra almeno osservandone le specifiche tecniche qui di seguito riportate.

GeForce 6800 Ultra: clock chip 400 MHz; clock memoria 1,1 GHz (DDR3);
GeForce 6800 PRO: clock chip 350 MHz; clock memoria 1 GHz (DDR3);
GeForce 6800: clock chip 350 MHz; clock memoria 700 MHz (DDR).

Stando ai dati attualmente disponibili, e non provenienti ufficialmente da NVIDIA, la scheda PRO dovrebbe posizionarsi a ridosso della soluzione 6800 Ultra in termini di frequenze di clock, con una bandwidth della memoria comparabile. Mancano dati sul numero di pipeline integrate nel chip 6800 PRO, ma pare presumibile che siano pari a 12 come per la scheda GeForce 6800, e non le 16 presenti invece nel chip GeForce 6800 Ultra.

Un numero di pipeline pari a 12 permetterebbe, inoltre, di distanziare maggiormente le soluzioni tra di loro, posizionando chiaramente la soluzione GeForce 6800 Ultra come top della gamma.

Qualora venga confermata, la GeForce 6800PRO sembra pensata per essere posizionata aquale diretta concorrente della scheda ATI Radeon X800PRO, per la quale si prevede il debutto nelle prossime settimane e che, stando a varie fonti on line, dovrebbe integrare 12 pipeline di rendering.

Non ci è stato possibile contattare NVIDIA per un commento al momento della pubblicazione della notizia
ciao.
:)

Haku
26-04-2004, 19:02
:eek: :eek: :eek:

Dark Schneider
26-04-2004, 19:08
La 6800 Pro è molto interessante e sicuramente avrà 256 MB secondo me...che probabilmente da noi avrà un costo di 400 euro max. In più ha le DDR3 come la Ultra e non DDR1 come la liscia.

Non si sa nulla ancora delle Pipeline......io sinceramente spero siano 16 e non 12.

Chissà se richiederà il doppio molex o gliene basterà una.

Raven
26-04-2004, 19:38
... confermati dunque i 400mhz di clock sulla gpu...

Perfectdavid
26-04-2004, 20:00
io penso saranno 12 altrimenti è una ultra regalata...invece con 12 ci sarà la giusta distanza fra le 3 schede...

Dark Schneider
26-04-2004, 20:07
Originariamente inviato da Raven
... confermati dunque i 400mhz di clock sulla gpu...

Beh staremo a vedere se la Ultra sarà a 400 Mhz!! :)

Dark Schneider
26-04-2004, 20:10
Originariamente inviato da Perfectdavid
io penso saranno 12 altrimenti è una ultra regalata...invece con 12 ci sarà la giusta distanza fra le 3 schede...

Io spero 16!! :D
Cioè alla fine ci hanno sempre "regalato" fino al NV35 delle versioni del tutto identiche alla Ultra frequenze a parte...non potrebbero regalarci ancora una volta un simile modello?:D

Magari è difficile...ma io voglio sperarci. :)

Alla fine cavolo un modello Pro con 16 Pipeline che si scontrerebbe con la X800Pro e le sue 12 Pipeline....sarebbe un punto a favore per nVidia.

Poi alla fine sarà a 12....

Perfectdavid
26-04-2004, 20:11
ti vedo molto convinto ghgh...

pon 87
26-04-2004, 20:23
Originariamente inviato da Dark Schneider
La 6800 Pro è molto interessante e sicuramente avrà 256 MB secondo me...che probabilmente da noi avrà un costo di 400 euro max. In più ha le DDR3 come la Ultra e non DDR1 come la liscia.

Non si sa nulla ancora delle Pipeline......io sinceramente spero siano 16 e non 12.

Chissà se richiederà il doppio molex o gliene basterà una.
se avesse 16 pipeline la 6800 pro sarebbe molto appetibile:D

Vifani
26-04-2004, 20:30
Originariamente inviato da Raven
... confermati dunque i 400mhz di clock sulla gpu...

Ma è ovvio... Lo hanno presentato come 400 Mhz e sarà a 400 Mhz.

Se poi ci saranno produttori come Albatron che lo vorranno overcloccare, è un altro discorso. Anche Gainward pompava le 5950 Ultra con il raffreddamento a liquido.

pon 87
26-04-2004, 20:34
ma è veramente ufficiale che la albatron avrà ben 600 mhz di core contro i 400 stabiliti?

Perfectdavid
26-04-2004, 20:39
se realmente usciranno schede con core a 600...tanto di cappello...le lisce saliranno a 500...

Sawato Onizuka
26-04-2004, 20:46
Originariamente inviato da Dark Schneider
Si ma ad esempio? Tipo na scheda che costa un equivalente di 200 euro in sterline.....con le spese quanto verrebbe?

ma no :muro: le VGA in altri stati UE più vicini ... in UK grazie al cambio son sconvenienti (le ram invece :D ) ... riprova sarai più fortunato :sofico: ;) :p :p :p :p

Dark Schneider
26-04-2004, 21:26
Originariamente inviato da Perfectdavid
ti vedo molto convinto ghgh...


Ehehhe no spè questa volta più che essere convinto di quello che dico....ci spero devo ammettere. :D
Alla fine una mossa del genere sarebbe un bel colpo penso :)

Dark Schneider
26-04-2004, 21:29
Originariamente inviato da Sawato Onizuka
ma no :muro: le VGA in altri stati UE più vicini ... in UK grazie al cambio son sconvenienti (le ram invece :D ) ... riprova sarai più fortunato :sofico: ;) :p :p :p :p


Vabbè cmq tipo una scheda video chessò che qui costa 300 euro acquistato in un altro paese UE con le spese incluse viene realmente molto meno? No perchè se è roba di 10-20 euro in meno no......se già si inizia a parlare di una cosa che complessivamente ci spendi 40-50 euro in meno è già un altra cosa. :)

Dark Schneider
26-04-2004, 21:31
Originariamente inviato da pon 87
se avesse 16 pipeline la 6800 pro sarebbe molto appetibile:D


Infatti!! :)

Cmq ragà mi chiedo se questo modello Pro richiederà il doppio molex o uno solo. Secondo voi?

Keyfaiv
26-04-2004, 21:33
Originariamente inviato da Dark Schneider
La 6800 Pro è molto interessante e sicuramente avrà 256 MB secondo me...che probabilmente da noi avrà un costo di 400 euro max. In più ha le DDR3 come la Ultra e non DDR1 come la liscia.


Credo personalmente che per ancora un po' di tempo troveremo schede che implementano "solo" 128 mega di ram (che sia DDR1, 2 o 3 e', per certi versi, alquanto irrilevante, se non per i consumi o il raffreddamento, non tanto per le prestazioni... a quanto ho potuto vedere... ma attendo smentite, logico...) :mc:


Non si sa nulla ancora delle Pipeline......io sinceramente spero siano 16 e non 12.


Se tu avessi ragione, ci sarebbe davvero da pensare:
perche' proporre due prodotti di fascia alta a prezzi differenti e con prestazioni molto vicine (soprattutto grazie ad un buon overclock)? Nessuno o quasi punterebbe sulla versione ultra, sarebbe nettamente da preferire la versione Pro... E' quasi come vendere due ferrari, la prima al prezzo di 480.000€ e la seconda a 410.000€, la cui unica differenza e' che la prima tocca i 340km/h e la seconda arriva a 312km/h. Ne vale la pena? nahhhh :D


Chissà se richiederà il doppio molex o gliene basterà una.

Probabile che anche in questo caso, essendo fin troppo vicina al modello top, sia consigliato caldamente l'uso del doppio molex... beninteso che ogni cosa da me scritta e' cmq frutto di congetture dovute alle info carpite in giro :D

Dark Schneider
26-04-2004, 21:37
Originariamente inviato da Keyfaiv
Credo personalmente che per ancora un po' di tempo troveremo schede che implementano "solo" 128 mega di ram (che sia DDR1, 2 o 3 e', per certi versi, alquanto irrilevante, se non per i consumi o il raffreddamento, non tanto per le prestazioni... a quanto ho potuto vedere... ma attendo smentite, logico...) :mc:



Se tu avessi ragione, ci sarebbe davvero da pensare:
perche' proporre due prodotti di fascia alta a prezzi differenti e con prestazioni molto vicine (soprattutto grazie ad un buon overclock)? Nessuno o quasi punterebbe sulla versione ultra, sarebbe nettamente da preferire la versione Pro... E' quasi come vendere due ferrari, la prima al prezzo di 480.000€ e la seconda a 410.000€, la cui unica differenza e' che la prima tocca i 340km/h e la seconda arriva a 312km/h. Ne vale la pena? nahhhh :D



Probabile che anche in questo caso, essendo fin troppo vicina al modello top, sia consigliato caldamente l'uso del doppio molex... beninteso che ogni cosa da me scritta e' cmq frutto di congetture dovute alle info carpite in giro :D


Si ma appunto considera che fino a NV35 nella fascia alta modelli identici alla Ultra c'erano sempre solo con frequenze diverse.
E' la prima volta che la liscia è castrata rispetto alla Ultra. Chissà forse la Pro non lo sarà. :)
Certo so che è molto probabile che sarà a 12.....però io ci voglio sperare.;)

Keyfaiv
26-04-2004, 21:42
Originariamente inviato da Perfectdavid
se realmente usciranno schede con core a 600...tanto di cappello...le lisce saliranno a 500...

Questo, come ormai sappiamo, e' il default per molti di noi: overclock a manetta!!! :sofico: In ogni caso, non e' detto che per risparmiare, soprattutto sulle lisce, non vengano montate versioni gia' al limite... e che concedano poco overclock... in fin dei conti, se vengono vendute per andare a 400, nessuno obbliga il produttore a farle in modo che possano sopportare alcun overclock.. sbaglio?

Keyfaiv
26-04-2004, 21:46
Originariamente inviato da Dark Schneider
Si ma appunto considera che fino a NV35 nella fascia alta modelli identici alla Ultra c'erano sempre solo con frequenze diverse.
E' la prima volta che la liscia è castrata rispetto alla Ultra. Chissà forse la Pro non lo sarà. :)
Certo so che è molto probabile che sarà a 12.....però io ci voglio sperare.;)

E' vero... spesso e volentieri ci sono stati modelli differenziati solo dalle frequenze, ma al giorno d'oggi sono fin troppe le persone che sanno fare overclock e che se ne approfittano :D
Ora come ora, soprattutto per le prestazioni raggiunte anche dal "nemico" Ati, si ha la necessita' di differenziare per bene il prodotto, in modo da far capire cosa e' meglio di cosa, cercando di posizionarsi bene sulle tre fase di mercato: bassa, media e alta.
Creare altre posizioni non e' + molto interessante, anche se poi, sono proprio determinate schede a vendere di +...
Cmq vedremo... soprattutto per il numero di pipeline

Dark Schneider
26-04-2004, 22:03
Originariamente inviato da Keyfaiv
E' vero... spesso e volentieri ci sono stati modelli differenziati solo dalle frequenze, ma al giorno d'oggi sono fin troppe le persone che sanno fare overclock e che se ne approfittano :D
Ora come ora, soprattutto per le prestazioni raggiunte anche dal "nemico" Ati, si ha la necessita' di differenziare per bene il prodotto, in modo da far capire cosa e' meglio di cosa, cercando di posizionarsi bene sulle tre fase di mercato: bassa, media e alta.
Creare altre posizioni non e' + molto interessante, anche se poi, sono proprio determinate schede a vendere di +...
Cmq vedremo... soprattutto per il numero di pipeline


Si ma proprio adesso che me lo devo comprare io devono fare sto ragionamento questi?:D Fatelo per il NV45 please!!:D

dwfgerw
26-04-2004, 22:43
se volete sapere di + su R420 fek ci ha illuminato....
leggete da qui PAG 31

http://www.nvitalia.com/forum/showthread.php?s=&threadid=34436&perpage=15&pagenumber=31


ha provato un sample....


bye;)

JENA PLISSKEN
26-04-2004, 22:47
Originariamente inviato da dwfgerw
se volete sapere di + su R420 fek ci ha illuminato....
leggete da qui PAG 31

http://www.nvitalia.com/forum/showthread.php?s=&threadid=34436&perpage=15&pagenumber=31


ha provato un sample....


bye;)

Beh...illuminato è dire troppo:sofico:

MaBru
26-04-2004, 23:09
Originariamente inviato da Dark Schneider
Si ma appunto considera che fino a NV35 nella fascia alta modelli identici alla Ultra c'erano sempre solo con frequenze diverse.
E' la prima volta che la liscia è castrata rispetto alla Ultra. Chissà forse la Pro non lo sarà. :)
Certo so che è molto probabile che sarà a 12.....però io ci voglio sperare.;)

Io credo proprio che non ripetano più la stessa cazzata di proporre una liscia con le stesse caratteristiche della ultra solo con clock minori, quando con un po' di overclock la porti magari a frequenze anche maggiori della ultra

Miky83
26-04-2004, 23:13
Originariamente inviato da Dark Schneider
Cmq l'iva va applicata non al prezzo al dollaro...ma a quanto vale in euro. Per la serie: 499 dollari non è 499 euro + iva.

Esatto ma i commercianti di solito(si si) TENDONO AD ARROTONDARE e si va a 500+iva=600 €uri

voilà 600 € e se non gli bastano, per guadagnare di più un ventone=620 €

Mi sbaglio?;)

Che possiamo fà?:mc:

ballero
26-04-2004, 23:29
Comprarla all'estero:)

Dark Schneider
26-04-2004, 23:31
Originariamente inviato da Miky83
Esatto ma i commercianti di solito(si si) TENDONO AD ARROTONDARE e si va a 500+iva=600 €uri

voilà 600 € e se non gli bastano, per guadagnare di più un ventone=620 €

Mi sbaglio?;)

Che possiamo fà?:mc:


Io veramente ti dico: a fine dicembre inizio gennaio la 5900XT uscì fuori che negli USA veniva 200 dollari. Prezzo qui in Italia della POV? 220 euro.

Mi pare che al cambio di allora i 200 dollari valevano sui 163 euro. Certo lì la 5900xt la pagavano quindi 160 euro. Qui ai 163 euro ci hanno calcolato l'Iva: poco più dei 190 euro. Poi qui con qlc tassetta in più stava a 220(la POV).
Alla fine non è che stava a molto. Certo rispetto a lì son 70 euro in più, ma cmq non era il prezzo in dollari + iva. L'avremo pagata sennò oltre i 250 euro qui..considerando i 200 dollari + l'iva e altre tassette.

Io dico che la liscia starà alla fine sui 300-310 euro. La Pro 400-415 euro. La Ultra il prezzo che invece conosciamo.

Al momento non so quant'è l'attuale cambio.

Miky83
26-04-2004, 23:37
Allora a questo punto non ci resta che attendere e sperare:)


altrimenti...

...ALTRIMENTI CI ARRABBIAMO:D

Dark Schneider
26-04-2004, 23:55
Ora sono più fiducioso nei prezzi.

nonikname che ha un negozio di pc ha chiesto info alla MSI riguardo le 6800 Ultra e liscia. Lui ne ha ordinati 2 di MSI 6800 Ultra e le pagherà 439 euro...ovviamente senza iva...perchè lui ha il vantaggio di non pagare l'iva. 439 euro + iva = 526 euro. Alla fine è attendibile come prezzo.

La 6800 liscia gli hanno comunicato che costa 229 euro.......naturalmente senza Iva. Beh se applichiamo l'iva: 229 + iva = 276 euro!! :)
Cavolo mica male,eh? E' sinceramente questo prezzo si addice molto ad una scheda nuova...ma con 128 MB.

Io penso che la Pro starà sui 380-400 euro. Ma purtroppo fino a quando non verrà ufficializzata la Pro..ancora non potremo sapere i prezzi. Ma cmq starà nel mezzo.

MaBru
26-04-2004, 23:58
Originariamente inviato da Dark Schneider
Ora sono più fiducioso nei prezzi.

nonikname che ha un negozio di pc ha chiesto info alla MSI riguardo le 6800 Ultra e liscia. Lui ne ha ordinati 2 di MSI 6800 Ultra e le pagherà 439 euro...ovviamente senza iva...perchè lui ha il vantaggio di non pagare l'iva. 439 euro + iva = 526 euro. Alla fine è attendibile come prezzo.

E il ricarico? Dovrà pur guadagnare qualcosa sto pover uomo...;)

Miky83
27-04-2004, 00:01
Originariamente inviato da MaBru
E il ricarico? Dovrà pur guadagnare qualcosa sto pover uomo...;)

Quoto, poverello:p


Sinceramente tendo molto sulle versioni Ultra...Ati o Nvidia non importa...quella che rulla di più:D

Dark Schneider
27-04-2004, 00:23
Originariamente inviato da MaBru
E il ricarico? Dovrà pur guadagnare qualcosa sto pover uomo...;)


Certo ma 350 euro ripeto per me son impossibili per la liscia da 128 MB. Magari costerà sui 300-310 alla fine.

Poi ad esempio può essere benissimo che adesso inizialmente gli viene la liscia 229 euro.....magari quando la diposnibilità sarà ampia...le pagherà anche meno...ed il prezzo sarà sui 280 euro per l'utente.

Dark Schneider
27-04-2004, 00:25
Originariamente inviato da Miky83



Sinceramente tendo molto sulle versioni Ultra...Ati o Nvidia non importa...quella che rulla di più:D


Io tendo molto per le 16 Pipeline. Se la 6800 Pro mi fa il piacere di averle...mi farebbe felice molto!!:D

rubex
27-04-2004, 03:12
Date un okkio a questo:

LINK (http://www.driverheaven.net/showthread.php?threadid=44253&)


http://www.driverheaven.net/V3/FCgraph.JPG

BYe

Thunder82
27-04-2004, 03:18
Originariamente inviato da rubex
Date un okkio a questo:

LINK (http://www.driverheaven.net/showthread.php?threadid=44253&)


http://www.driverheaven.net/V3/FCgraph.JPG

BYe

Ed ecco che vengono fuori gli altarini ;)

As you can see the results are considerably different for the 6800 when the R300 device ID is forced. In addition to the 6800Ultra then using the same pixel shaders as the Radeon card the display issues which are well documented on the internet are fixed by using the Radeon path.

One other point of note is that the Radeon 9800XT is very close in performance to the 6800Ultra at the same IQ levels. Only 7fps in average framerates separate the cards which is a phenomenal result for the Radeon.

Per chi si chiede se la 6800 può essere penalizzata facendola andare con la R300-path la risposta è NO:

[i]It shouldn't. The R300's path is just pure 2.0 while the nVidia path is a mix between 2.0 & 1.1.

IF nVidia's cards actually run dx9 specs, they shouldn't have any problem. There isn't anything proprietary to ATi on the R300's path, just to 2.0.

It is NOT a case of forcing the 6800 to run the "ATi optimized path", it's just a case of forcing the 6800 to run the "dx9 path" rather than the "dx8&9 mixed-mode path".


Quindi a parità di qualità (pura dx9) la 6800U va come la 9800xt...

Thunder82
27-04-2004, 03:35
http://translate.google.com/translate?u=http%3A%2F%2Fwww.tommti-systems.de%2Fstart.html&langpair=de%7Cen&hl=en&ie=UTF-8&oe=UTF-8&prev=%2Flanguage_tools

We omitted here the stored Shader(<2.0, for clarity), which runs on the NV3x and the R3xx into the level shown down. With NVIDIA's NV3x in some places 1.1'er Shader is used, where one gets on ATi's R3xx 2.0'er. Thus the partial lower image quality on NV3x maps is to be explained. Both Screenshots come from the Radeon 9800 pro, once by 3D-Aanalyze(noch not available beta version!) as NVIDIA map "camouflaged" and once not:

http://www.tommti-systems.de/main-Dateien/MISC/FarCry0001.jpg
R3xx (NVIDIA DEVICE ID)

http://www.tommti-systems.de/main-Dateien/MISC/FarCry0002.jpg
R3xx (ATi DEVICE ID)

"Shader of this level in the comparison:
R3xx (ATi DEVICE ID)
44 HP OF 2,0/HP 2.X
100 HP of 1.1
164 VS 1.x
7 VS 2.x


R3xx (NVIDIA DEVICE ID)
39 HP OF 2,0/HP 2.X
113 HP of 1.1
182 VS 1.x
2 VS 2.x

Thus the past results of bench mark of NVIDIA and ATi hardware are void, since both maps with different tasks were fed."

So basically by telling the game that the ATI card is an Nvidia card the game runs with fewer PS2.0 shaders and more Ps1.1 and 1.x shaders. You would think that the 6800u would chew up the Ps2.0 code and spit it out like nothing considering it is supposed to handle Ps3.0 so well. But in the tests here it doesn't beat the 9800XT by much at all.

Oh, and Tommti has some screen shots showing TWIMTBP in all its PS1.x ugliness.


:rotfl: :rotfl: :rotfl: :rotfl: :rotfl:

Rido per non piangere...

Paoletta Corsini
27-04-2004, 03:58
Originariamente inviato da Thunder82
Rido per non piangere...
Se ho capito bene.. mi viene la pelle d'oca :rolleyes:

ps: ma quel uin lì è solo per riempire il profilo o lo usi? :D

ATi7500
27-04-2004, 08:00
mmmmmmmmmm :rolleyes:

e brava nvidia


bYeZ!

Maury
27-04-2004, 08:30
:eekk: :rotfl: :asd:

Ugh < --- i post only faccine nn sn ammessi :sofico:

=>TaroKSoft<=
27-04-2004, 08:58
Originariamente inviato da Thunder82
http://translate.google.com/translate?u=http%3A%2F%2Fwww.tommti-systems.de%2Fstart.html&langpair=de%7Cen&hl=en&ie=UTF-8&oe=UTF-8&prev=%2Flanguage_tools

:rotfl: :rotfl: :rotfl: :rotfl: :rotfl:

Rido per non piangere...

:eek: Non posso crederci!!!:rolleyes: :rolleyes: :rolleyes:

ATi7500
27-04-2004, 09:15
Originariamente inviato da =>TaroKSoft<=
:eek: Non posso crederci!!!:rolleyes: :rolleyes: :rolleyes:

:sofico:

credici :D


bYeZ!

Athlon 64 3000+
27-04-2004, 09:26
Siamo sicuri che quel benchmark sia vero?

ATi7500
27-04-2004, 09:32
Originariamente inviato da Athlon 64 3000+
Siamo sicuri che quel benchmark sia vero?

credi ke certi siti skerzino così cn leggerezza cn un colosso come nvidia?


bYeZ!

redbaron
27-04-2004, 09:45
Originariamente inviato da Thunder82

http://www.tommti-systems.de/main-Dateien/MISC/FarCry0001.jpg
R3xx (NVIDIA DEVICE ID)



Io, sinceramente, il pavimento non l'ho MAI visto cosi'.... (fx 5900 ultra)
Questo "camouflage" mi sa che non funziona molto bene. :O

Adriano77
27-04-2004, 09:50
incredibile
facendo usare a NV40 gli shader che usa r300 il punteggio cambia di molto in peggio, e spariscono gli artefatti con far cry.

Nvidia ha truccato i suoi driver non c'e' alcun dubbio...

leggete...

http://www.driverheaven.net/showthread.php?s=&threadid=44253

ShadowThrone
27-04-2004, 10:13
annamo bene... :rolleyes:

Legolas84
27-04-2004, 10:23
Io aspetterei una nuova relase di driver.... se poi nVidia riesce a chattare i driver senza perdere qualità e andando di più... be che lo faccia..... speriamo che lo faccia.

Altrimenti c'è ancora ATi....

Ma in ogni caso aspetto a sparare a zero...

Adriano77
27-04-2004, 10:26
faccio notare che gli shader che eseguo il radeon 9800 non sono shader ottimizzati, ma sono gli shader che ANDREBBERO eseguiti per identificare il gioco che li usa come DIRECTX 9 COMPLIANT...

Cosa vuol dire questo ?

Ve lo spiego io... vuole dire che NV40 non rispetta le specifiche directx 9 e utilizza un misto fra gli shader 2.0 e 1.1, in una solita di modalita' MIXED.

Vi ricordate lo scandalo con HL2 durante la presentazione dello shader day di Ati ?

Beh avevano ragione loro quelli della valve, e Nvidia non ha risolto il problema con NV40.

BAH che schifo.

ATi7500
27-04-2004, 10:35
Originariamente inviato da Legolas84
se poi nVidia riesce a chattare i driver senza perdere qualità e andando di più... be che lo faccia..... speriamo che lo faccia.



:asd: ma ke stai dicendo scusa? :asd:


bYeZ!

Legolas84
27-04-2004, 10:40
Che sto dicendo? che se i forceware che ho su ora sono chattati non me ne frega niente.... perchè io che avevo un 9700pro non noto differenze.... solo l'AA è un pò peggiore e l'openGL migliore.... tutto qui.... dico che come sempre costruite castelli....

redbaron
27-04-2004, 10:43
Originariamente inviato da Adriano77
Cosa vuol dire questo ?

Ve lo spiego io... vuole dire che NV40 non rispetta le specifiche directx 9 e utilizza un misto fra gli shader 2.0 e 1.1, in una solita di modalita' MIXED.


BAH che schifo.

Rilassati. I 15 post, sono tutti cosi' flammanti ?
Guarda che malgrado questo sia un thread sulla 6800, non siamo mica tonti eh ? Alla fine prenderemo la scheda piu' performante o quella che ci sta piu' simpatica, se le prestazioni rimarranno vicine. Aspetta a trarre le tue illuminanti conclusioni. Non e' stato ancora dimostrato nulla, i driver usati (60.xx) non si possono cambiare al momento e si sa che qualche problemino ce l'hanno.
Aspettiamo e poi decidiamo con tutta calma. ;)

MaBru
27-04-2004, 10:44
Raga, mi sono appena svegliato, non ho ancora il cervello a regime di sopravvivenza. :D

Me la spiegate?

halduemilauno
27-04-2004, 10:44
Originariamente inviato da Legolas84
Che sto dicendo? che se i forceware che ho su ora sono chattati non me ne frega niente.... perchè io che avevo un 9700pro non noto differenze.... solo l'AA è un pò peggiore e l'openGL migliore.... tutto qui.... dico che come sempre costruite castelli....


giusto e...
Pentium 4 2,4C @ 3,5Ghz | Asus P4C800 vmod | POV GeForce 5900XT @ 520 / 1000
...complimenti.
ciao.
;)

Thunder82
27-04-2004, 11:04
Originariamente inviato da Paoletta Corsini
Se ho capito bene.. mi viene la pelle d'oca :rolleyes:

ps: ma quel uin lì è solo per riempire il profilo o lo usi? :D

è solo per riempire il profilo, ci stava male lo spazio vuoto :asd:

Thunder82
27-04-2004, 11:06
Originariamente inviato da MaBru
Raga, mi sono appena svegliato, non ho ancora il cervello a regime di sopravvivenza. :D

Me la spiegate?

Hanno fatto andare NV40 in pura path dx9 (r300 deviceid) e questo è il risultato... come la 9800xt o poco più

http://www.driverheaven.net/V3/FCgraph.JPG

Athlon 64 3000+
27-04-2004, 11:15
A vedere dalle immagini e dai i benchmark sembre proprio che Nvidia abbia truccato i driver come al solito e si è riuscito a smascherarla.Io preferisco aspettare un'altra realese di Driver più matura e aspettare La presentazione dell'R420 per decidere come è questa NV40.

MaBru
27-04-2004, 11:19
Originariamente inviato da Thunder82
Hanno fatto andare NV40 in pura path dx9 (r300 deviceid) e questo è il risultato... come la 9800xt o poco più

[IMG]

denghiu. :)

Jedi_Master
27-04-2004, 11:21
Originariamente inviato da Thunder82
Hanno fatto andare NV40 in pura path dx9 (r300 deviceid) e questo è il risultato... come la 9800xt o poco più

Che e' un po' quello che temevo dall'inizio.......
:(
Ho un dubbio pero'.
Mi sembra che nessuno nemmeno con la 9800XT riesce a
giocare a Far Cry a 1600x1200, mentre se i frame fossero
quelli mostrati (tra 20 e 40) sarebbe possibile.... :muro:
La domanda e' (per chi ha un sistemone con 9800xt) cosa
ne dite di quel grafico??
E' plausibile o e' un pacco anti-nvidia??

xpiuma
27-04-2004, 11:36
Uffa!! :ncomment:

Io ero intenzionato a prendere NV4x (quale non so ancora...), ma passando ad una scheda di generazione successiva vorrei si un aumento delle prestazioni, ma giocare a 80fps o 100fps non mi cambia molto, ma voglio soprattutto la qualità!!!

Da nVidia straparlano dei loro VS e PS 3.0 ma non fanno neanche bene i 2.0!! E dicono di ATI che non utilizzerà i 3.0...
Spero che anche questa cosa sia dovuta all'immaturità dei driver, e che con l'arrivo di quelli definitivi NV40 si dimostri un gioiellino, ma se avrà ancora anche solo 1 dei problemi di cui si parla (fp16, cheat, ecc...) mi prendo ATI.

Preferite una Renault5 GT turbo o una AUDI A3???

Perfectdavid
27-04-2004, 11:39
sicuramente la renault 5 gt turbo...

=>TaroKSoft<=
27-04-2004, 11:56
Originariamente inviato da xpiuma
Preferite una Renault5 GT turbo o una AUDI A3???

:asd:

L'esempio non ci azzecca x niente!!! :D

Magari se dicevi tra r5 gt turbo e audi s3... ci azzeccava un po' di più... :sofico:

Jedi_Master
27-04-2004, 12:03
Originariamente inviato da Jedi_Master
Mi sembra che nessuno nemmeno con la 9800XT riesce a
giocare a Far Cry a 1600x1200, mentre se i frame fossero
quelli mostrati (tra 20 e 40) sarebbe possibile.... :muro:
La domanda e' (per chi ha un sistemone con 9800xt) cosa
ne dite di quel grafico??
E' plausibile o e' un pacco anti-nvidia??

Mi auto-quoto.....
nessuno risponde??
:(

R@nda
27-04-2004, 12:17
Originariamente inviato da Jedi_Master
Mi auto-quoto.....
nessuno risponde??
:(

Ma scusa hai una 9800pro clocckala un pò e provala.

Cmq FarCry andava in modalità mista anche prima.....voglio dire,Nv40 e pur sempre un 16/32 FP come lo erano le 5950.

Inoltre tenete presente che forzandolo in quel modo va fisso in FP32 contro i Fp24 delle Ati.

La qualità forse non aumenta più di tanto da 24 a 32 bit ma le prestazioni calano senz'altro e anzi per andare full Fp32 non se la cava proprio male.

La qualità invece come già detto qui dipende dai driver e non dal fatto che vada a Fp16.

Quindi....aspettiamo sti benedetti driver ufficiali e l'uscita della concorrenza.

Poi vediamo chi dobbiamo bastonare
:D

Jedi_Master
27-04-2004, 12:20
Originariamente inviato da R@nda
Ma scusa hai una 9800pro clocckala un pò e provala.


E vabbe' (gia' fatto) pero' mi manca tutto il resto.....
Ovvero con sistemone intendevo almeno un'athlon 64
con giga di ram eccetera.......

R@nda
27-04-2004, 12:20
Originariamente inviato da Jedi_Master
E vabbe' (gia' fatto) pero' mi manca tutto il resto.....
Ovvero con sistemone intendevo almeno un'athlon 64
con giga di ram eccetera.......

Pfiu....particolari

:D

Jedi_Master
27-04-2004, 12:41
Originariamente inviato da R@nda
Pfiu....particolari

:D

Mica tanto, col 2400+ ho notato spesso in piu' applicazioni
di essere cpu-limited e a volte non di poco.
:)
Per il resto non sono d'accordo con te quando dici :
".....anzi per andare full Fp32 non se la cava proprio male.".
Questa nuova generazione di schede dovrebbe fare
molto meglio anche con la full precision, ovviamente IMHO.
ciao

R@nda
27-04-2004, 12:45
Si scherzavo:)

Bhe...Yoss e Fek hanno già affermato che nemmeno con questa generazione la FP32 non verrà utilizzata....o solo limitatamente.

A questo punto mi chiedo perchè anche Nvidia non abbia utilizzato
una Fp24 come Ati.....ma questo non lo so proprio.

Jedi_Master
27-04-2004, 12:54
Originariamente inviato da R@nda
A questo punto mi chiedo perchè anche Nvidia non abbia utilizzato
una Fp24 come Ati.....ma questo non lo so proprio.

Premetto che non posso saperlo...
:D
Su questo pero' ci sara' stato anche un po' di orgoglio credo.
Dopotutto gia' hanno dovuto 'scopiazzare' almeno in parte
le tecniche di antialias e di filtro aniso di ATI, se cedevano
anche su quello sarebbe stato uno smacco....credo.
:)
Forse sarebbe stata una buona idea inserire una scalabilita'
pressoche' completa 16/24/32.
Ma forse e' proprio la possibilita' di un paragone diretto
che vogliono evitare, e quello e' un buon modo x farlo.
ciauz

Thunder82
27-04-2004, 13:22
Originariamente inviato da R@nda
Ma scusa hai una 9800pro clocckala un pò e provala.

Cmq FarCry andava in modalità mista anche prima.....voglio dire,Nv40 e pur sempre un 16/32 FP come lo erano le 5950.

Inoltre tenete presente che forzandolo in quel modo va fisso in FP32 contro i Fp24 delle Ati.

La qualità forse non aumenta più di tanto da 24 a 32 bit ma le prestazioni calano senz'altro e anzi per andare full Fp32 non se la cava proprio male.

La qualità invece come già detto qui dipende dai driver e non dal fatto che vada a Fp16.

Quindi....aspettiamo sti benedetti driver ufficiali e l'uscita della concorrenza.

Poi vediamo chi dobbiamo bastonare
:D

Il punto è che il path nVidia non prevede un semplice FP16, ma sostituisce molti shader 2.0 addirittura con shader 1.1...

R@nda
27-04-2004, 13:25
Originariamente inviato da Thunder82
Il punto è che il path nVidia non prevede un semplice FP16, ma sostituisce molti shader 2.0 addirittura con shader 1.1...

Se io con la 5900Xt metto tutto in Very high lo vedo che utilizza i Ps2.0....solo che la qualità non è come nella controparte Ati.
O no?

Edit:
Però è vero,nel log il Path Nv3X sostituisce gli shader 2.0 con 1.1....e va in fp16.

Drio
27-04-2004, 13:29
Originariamente inviato da Thunder82
Hanno fatto andare NV40 in pura path dx9 (r300 deviceid) e questo è il risultato... come la 9800xt o poco più

http://www.driverheaven.net/V3/FCgraph.JPG


la differenza di circa 8-9 frame è la stessa che c è da una 9700 liscia a una 9800 pro eppure tanti sostengono che tra queste 2 schede ci sia una bella differenza, come dire, 2 pesi 2 misure

MaBru
27-04-2004, 13:36
Originariamente inviato da Jedi_Master
Dopotutto gia' hanno dovuto 'scopiazzare' almeno in parte
le tecniche di antialias e di filtro aniso di ATI

Se è per questo anche il RGMS di Ati è scopiazzato da quello che 3DFX aveva introdotto con il VSA-100.

andreamarra
27-04-2004, 13:40
:eek:

Cmq non credo che siano dei fake, perchè come giustamente ha detto un utente poco fa non puoi andare senza prove e falsando dei grafici contro un colosso mondiale come è nVidia.... che in sede legale si appropria anche delle tue mutande...

Mi sa che anche a questo giro ci sarà monopolio ATI... :cry: :Prezzialti:

R@nda
27-04-2004, 13:44
Si ma rimane il fatto che le due marche non sono paragonabili in recensione.

Ci sono sempre 8 bit in negativo o in positivo in ogni caso.

Ati va sempre in Fp24

Se la paragoni a Nvidia in FP16 non è corretto perchè è nettamente avvantaggiata.

Se fai andare Nvidia in Fp32 è svantaggiata questa nei confronti di Ati.

Ma che bello....

Jedi_Master
27-04-2004, 13:45
Originariamente inviato da Drio
la differenza di circa 8-9 frame è la stessa che c è da una 9700 liscia a una 9800 pro eppure tanti sostengono che tra queste 2 schede ci sia una bella differenza, come dire, 2 pesi 2 misure

Beh se ben ricordo con i filtri la 9800 perde meno del 9700.
Ma devi considerare che quello non era un salto generazionale,
solo poco piu' di overclock.
Mentre dalla nuova generazione ci si aspetta + o - il doppio
in presazioni a pari qualita' in quasi tutti i game.

ATi7500
27-04-2004, 13:47
Originariamente inviato da R@nda
Si ma rimane il fatto che le due marche non sono paragonabili in recensione.

Ci sono sempre 8 bit in negativo o in positivo in ogni caso.

Ati va sempre in Fp24

Se la paragoni a Nvidia in FP16 non è corretto perchè è nettamente avvantaggiata.

Se fai andare Nvidia in Fp32 è svantaggiata questa nei confronti di Ati.

Ma che bello....

il problema è, come ha gia sottolineato yossarian, ke la differenza qualitativa tra fp16 e fp24 è più alta d quanto nn lo sia quella tra fp24 e fp32...

imho la scelta di ati è più felice a mio parere (ammettendo ke anke r420 sia solamente fp24)


bYeZ!

R@nda
27-04-2004, 13:51
Originariamente inviato da ATi7500
il problema è, come ha gia sottolineato yossarian, ke la differenza qualitativa tra fp16 e fp24 è più alta d quanto nn lo sia quella tra fp24 e fp32...

imho la scelta di ati è più felice a mio parere (ammettendo ke anke r420 sia solamente fp24)


bYeZ!

Si...addirittura io tra Fp24 e 32 proprio differenze non ne vedo.

halduemilauno
27-04-2004, 13:53
Originariamente inviato da R@nda
Si ma rimane il fatto che le due marche non sono paragonabili in recensione.

Ci sono sempre 8 bit in negativo o in positivo in ogni caso.

Ati va sempre in Fp24

Se la paragoni a Nvidia in FP16 non è corretto perchè è nettamente avvantaggiata.

Se fai andare Nvidia in Fp32 è svantaggiata questa nei confronti di Ati.

Ma che bello....


nVidia ha insistito nell'essere dx9.0C e quindi la modalità FP32 è obbligatoria.
ciao.

;)

Thunder82
27-04-2004, 14:04
Originariamente inviato da R@nda
Se io con la 5900Xt metto tutto in Very high lo vedo che utilizza i Ps2.0....solo che la qualità non è come nella controparte Ati.
O no?

Edit:
Però è vero,nel log il Path Nv3X sostituisce gli shader 2.0 con 1.1....e va in fp16.

Dovrebbe venirti scritto "replace 2.0 with 1.1" o qualcosa del genere ;)

Adriano77
27-04-2004, 14:14
http://www.driverheaven.net/showthread.phps=&threadid=44253

http://www.driverheaven.net/showthread.php?s=&threadid=44253



Nei test effettuati da Driverheaven nei link appare chiaro come NV40 utilizza in Farcry una sorta di modalita' Mixed sfruttando i pixel shaders 1.1 quando invece andrebbero sfruttati i 2.0

Ati con la 9800XT rispetta pienamente i canoni directx 9 mentre Nvidia con NV40 no, e i drivers forzano la scheda a sfruttare i piu semplici e veloci 1.1 nonostante Farcry richieda i 2.0

In sostanza quello che hanno fatto gli ingegneri di Nvidia e' truccare i driver in modo che scelgano di utilizzare shader piu scadenti (la qualita' grafica peggiora di molto) anziche' gli shader propri delle directx 9.

I tester di driverheaven hanno invece provato a forzare l'utilizzo degli shader 2.0 su NV40 e cosa hanno ottenuto ?

Hanno ottenuto che NV40 va piu veloce di soli 7 FPS rispetto ad una 9800XT su farcry. (AverageFPS)

Questa e' una grossa delusione...

Oltretutto NV40 nella sua modalita' mista provoca con facry anche degli artefatti sullo schermo... ma se forzi l'utilizzo dell'r300 Path che e' directx9 fully Compliant allora questi artefatti non ci sono piu'... questa e' un ulteriore prova contro le "ottimizzazioni" di Nvidia.

Tant'e' vero che l'admin si chiede... ma Nvidia non dovrebbe offrire la miglior esperienza possibile a chi spende 500 euro per una scheda ?

halduemilauno
27-04-2004, 14:19
Originariamente inviato da Adriano77
http://www.driverheaven.net/showthread.phps=&threadid=44253

http://www.driverheaven.net/showthread.php?s=&threadid=44253



Nei test effettuati da Driverheaven nei link appare chiaro come NV40 utilizza in Farcry una sorta di modalita' Mixed sfruttando i pixel shaders 1.1 quando invece andrebbero sfruttati i 2.0

Ati con la 9800XT rispetta pienamente i canoni directx 9 mentre Nvidia con NV40 no, e i drivers forzano la scheda a sfruttare i piu semplici e veloci 1.1 nonostante Farcry richieda i 2.0

In sostanza quello che hanno fatto gli ingegneri di Nvidia e' truccare i driver in modo che scelgano di utilizzare shader piu scadenti (la qualita' grafica peggiora di molto) anziche' gli shader propri delle directx 9.

I tester di driverheaven hanno invece provato a forzare l'utilizzo degli shader 2.0 su NV40 e cosa hanno ottenuto ?

Hanno ottenuto che NV40 va piu veloce di soli 7 FPS rispetto ad una 9800XT su farcry. (AverageFPS)

Questa e' una grossa delusione...

Oltretutto NV40 nella sua modalita' mista provoca con facry anche degli artefatti sullo schermo... ma se forzi l'utilizzo dell'r300 Path che e' directx9 fully Compliant allora questi artefatti non ci sono piu'... questa e' un ulteriore prova contro le "ottimizzazioni" di Nvidia.

Tant'e' vero che l'admin si chiede... ma Nvidia non dovrebbe offrire la miglior esperienza possibile a chi spende 500 euro per una scheda ?

io aspetterei oltre ai driver ufficiali e certificati anche il rilascio delle dx9.0C. che sono o sarebbero...
ciao.


;)

Veghan
27-04-2004, 14:33
Prima si è ipotizzato che la scheda avesse una struttura 12+4 con le ultime 4 pileline nn in grado di elaborare gil shader di primo modello ma aventi solo le unità di elabirazione fp necessarie per gil shader 2.0 e maggiori. Questo motivava come in alcuni test directx8 la scheda fosse in percentuale meno veloce della 9800 rispetto ai test dx9. Se ho capito bene allora una operazione di shader replacement su un NV40 nn avrebbe senso poichè la scheda dispone di + unità per elaborare gli shader 2.0 di quanto nn ne disponga per l'elaborazione degli 1.x, quindi secondo me il problema è imputabile ai driver che probabilmente fanno comportare la scheda come un NV35 e nn come un nv40.

yossarian
27-04-2004, 15:12
Originariamente inviato da Veghan
Prima si è ipotizzato che la scheda avesse una struttura 12+4 con le ultime 4 pileline nn in grado di elaborare gil shader di primo modello ma aventi solo le unità di elabirazione fp necessarie per gil shader 2.0 e maggiori. Questo motivava come in alcuni test directx8 la scheda fosse in percentuale meno veloce della 9800 rispetto ai test dx9. Se ho capito bene allora una operazione di shader replacement su un NV40 nn avrebbe senso poichè la scheda dispone di + unità per elaborare gli shader 2.0 di quanto nn ne disponga per l'elaborazione degli 1.x, quindi secondo me il problema è imputabile ai driver che probabilmente fanno comportare la scheda come un NV35 e nn come un nv40.


un'operazione di shader replacement dà comunque qualche vantaggio, a causa della maggior complessità dei ps2.0 rispetto ai ps1.1. Il fatto che NV40 sia una 12+1 sembra confermato anche dal grafico 3DMark2001 SE di questa pagina, dove alla massima risoluzione, NV40 va circa un 31% in più rispetto ad R360 che è proprio quello che ci si aspetterebbe facendo il calcolo seguente:
NV40: 6*400= 2400
R360: 4*412=1648
la differenza è pari a 752 che è proprio il 31% circa di 2400
Questo perchè il chip ATi, quando utilizza PS1.x è capace di 12 operazioni (math e 8 text) per ciclo contro le 24 complessive quando utilizza PS2.0 (16 math e 8 text).

Valutando una complessità dei ps2.0 di almeno 4 volte superiore rispetto ai ps1.1 (a livello di pesantezza di calcolo per la gpu e si tratta di una stima approssimata per difetto se si considera anche l'adozione di nuove feature DX9), si vede che, in ogni caso, l'operazione di shder replacement porta dei benefici (anche all'R3x0 ed all'NV40).
Certo, rispetto ai vantaggi che portano alla serie NV3x quelli delle altre due sono molto minori. NV40 ed R3x0 riescono a "maneggiare" piuttosto bene anche i ps20.
Proprio relativamente a questi ultimi, faccio notare che esiste, nell'NV40 così come nell'NV3x, una dipendenza tra prima fpu e tmu di ogni pipeline (che secondo me è il punto debole di questa architettura); questo riduce le opssibili operazioni massime, quando si utilizzino ps2.0 o seguenti, dalle 48 (16*3) teoriche a 32 (16*2); il che conferisce all'NV40 un vantaggio del solo 25% rispetto alle 24 operazioni possibili per clock all'R360, che poi diventa circa un 22% se si considerano le leggermente diverse frequenze di clock.
Quindi, nell'elaborare una mixed path composta da shader 1.x e 2.0, c'è da aspettarsi un vantaggio non superiore, nella migliore delle ipotesi per NV40, al 31% (se la path è ps1.1 only).
Si tenga inoltre conto che, con un input di tipo "tradizionale", l'architettura superscalare dell'NV40 è leggermente meno performante di un'architettura più tradizionale come quella dell'R3x0.
Quindi, con una path come quella vista per farcry che fa buon uso di ps2.0 e di qualche vs2.0, non mi aspetterei, anche con nuovi drivers, punteggi superiori a 52-53 fps nel migliore dei casi

Thunder82
27-04-2004, 15:26
Originariamente inviato da yossarian
un'operazione di shader replacement dà comunque qualche vantaggio, a causa della maggior complessità dei ps2.0 rispetto ai ps1.1. Il fatto che NV40 sia una 12+1 sembra confermato anche dal grafico 3DMark2001 SE di questa pagina, dove alla massima risoluzione, NV40 va circa un 31% in più rispetto ad R360 che è proprio quello che ci si aspetterebbe facendo il calcolo seguente:
NV40: 6*400= 2400
R360: 4*412=1648
la differenza è pari a 752 che è proprio il 31% circa di 2400
Questo perchè il chip ATi, quando utilizza PS1.x è capace di 12 operazioni (math e 8 text) per ciclo contro le 24 complessive quando utilizza PS2.0 (16 math e 8 text).

Valutando una complessità dei ps2.0 di almeno 4 volte superiore rispetto ai ps1.1 (a livello di pesantezza di calcolo per la gpu e si tratta di una stima approssimata per difetto se si considera anche l'adozione di nuove feature DX9), si vede che, in ogni caso, l'operazione di shder replacement porta dei benefici (anche all'R3x0 ed all'NV40).
Certo, rispetto ai vantaggi che portano alla serie NV3x quelli delle altre due sono molto minori. NV40 ed R3x0 riescono a "maneggiare" piuttosto bene anche i ps20.
Proprio relativamente a questi ultimi, faccio notare che esiste, nell'NV40 così come nell'NV3x, una dipendenza tra prima fpu e tmu di ogni pipeline (che secondo me è il punto debole di questa architettura); questo riduce le opssibili operazioni massime, quando si utilizzino ps2.0 o seguenti, dalle 48 (16*3) teoriche a 32 (16*2); il che conferisce all'NV40 un vantaggio del solo 25% rispetto alle 24 operazioni possibili per clock all'R360, che poi diventa circa un 22% se si considerano le leggermente diverse frequenze di clock.
Quindi, nell'elaborare una mixed path composta da shader 1.x e 2.0, c'è da aspettarsi un vantaggio non superiore, nella migliore delle ipotesi per NV40, al 31% (se la path è ps1.1 only).
Si tenga inoltre conto che, con un input di tipo "tradizionale", l'architettura superscalare dell'NV40 è leggermente meno performante di un'architettura più tradizionale come quella dell'R3x0.
Quindi, con una path come quella vista per farcry che fa buon uso di ps2.0 e di qualche vs2.0, non mi aspetterei, anche con nuovi drivers, punteggi superiori a 52-53 fps nel migliore dei casi

Infatti in Far Cry con la path dx9 la 9800XT fa 40fps, la 6800U ne fa circa 48. 8 fps in più è esattamente il 20% in più :)

Un po' pochino per una scheda nuova da 550€

halduemilauno
27-04-2004, 15:26
http://www.theinquirer.net/?article=15555
;)

MaBru
27-04-2004, 15:28
Originariamente inviato da halduemilauno
http://www.theinquirer.net/?article=15555
;)

:)

yossarian
27-04-2004, 15:30
Originariamente inviato da Thunder82
Infatti in Far Cry con la path dx9 la 9800XT fa 40fps, la 6800U ne fa circa 48. 8 fps in più è esattamente il 20% in più :)

Un po' pochino per una scheda nuova da 550€

si, però il 20% dovrebbe essere la differenza se si usasse una path ps2.0 pura; nel caso di farcry mi aspetto, con i prossimi driver, qualche punto in più per l'NV40 (non i 60 fps visti con la path NV, ma qualcosa di meglio dei 48-49 della path definita R3x0).
Con path interamente dx9, purtroppo, ripeto, la dipendenza tra fpu e tmu può essere un handicap.

andreamarra
27-04-2004, 15:32
Originariamente inviato da yossarian
si, però il 20% dovrebbe essere la differenza se si usasse una path ps2.0 pura; nel caso di farcry mi aspetto, con i prossimi driver, qualche punto in più per l'NV40 (non i 60 fps visti con la path NV, ma qualcosa di meglio dei 48-49 della path definita R3x0).

Anch'io da tanto tempo aspetto dei driver che possano ribaltare il gap nei ps2.0... la cosa inquietante è che mi sto convincendo sempre più che sia un errore strutturale a cui non si può rimediare con un semplice driver... :(

yossarian
27-04-2004, 15:37
Originariamente inviato da andreamarra
Anch'io da tanto tempo aspetto dei driver che possano ribaltare il gap nei ps2.0... la cosa inquietante è che mi sto convincendo sempre più che sia un errore strutturale a cui non si può rimediare con un semplice driver... :(


stavolta hanno modificato l'architettura, ispirandosi molto all'R3x0.
Quello che non capisco è il motivo per cui non abbiano eliminato la dipendenza tra unità di calcolo della stessa pipeline (ereditata dall'NV3x). Di fatto le prime fpu lavorano a pieno regime solo in assenza di texture fetch.
Se ATi sarà riuscita a mantenere l'architettura dell'R3x0, raddoppiando il numero di pipeline, avrà un potenziale di 48 operazioni totali per ciclo nelle pipeline di rendering, ossia un 33% in più rispetto all'NV40, che diventa un 46% se si tiene conto delle differenze di clock (400 contro i probabili 500 della X800XT).
Questo è un gap che non si recupara con i drivers (a meno di non "ottimizzare" oltre il lecito)

xpiuma
27-04-2004, 15:46
Originariamente inviato da yossarian
stavolta hanno modificato l'architettura, ispirandosi molto all'R3x0.
Quello che non capisco è il motivo per cui non abbiano eliminato la dipendenza tra unità di calcolo della stessa pipeline (ereditata dall'NV3x). Di fatto le prime fpu lavorano a pieno regime solo in assenza di texture fetch.
Se ATi sarà riuscita a mantenere l'architettura dell'R3x0, raddoppiando il numero di pipeline, avrà un potenziale di 48 operazioni totali per ciclo nelle pipeline di rendering, ossia un 33% in più rispetto all'NV40, che diventa un 46% se si tiene conto delle differenze di clock (400 contro i probabili 500 della X800XT).
Questo è un gap che non si recupara con i drivers (a meno di non "ottimizzare" oltre il lecito)

Sarà davvero interessante vedere all'opera R420 tra qualche giorno...
Quello che hai scritto (se tutto sarà così) potrebbe essere una seria mazzata a nVidia.
Ma spero che si risolva tutto nel migliore dei modi con dei driver...:fagiano:

yossarian
27-04-2004, 16:18
Originariamente inviato da xpiuma
Sarà davvero interessante vedere all'opera R420 tra qualche giorno...
Quello che hai scritto (se tutto sarà così) potrebbe essere una seria mazzata a nVidia.
Ma spero che si risolva tutto nel migliore dei modi con dei driver...:fagiano:

il mio riferimento era realtivo alla sola esecuzione dei ps2.0 in abbinamento ad operazioni di texture fetch. Non è necessariamente vero che questo si traduca in un analogo gap nelle reali prestazioni, su cui influiscono altri fattori. Crto, in quelle applicazioni in cui la differenza è dattata principalmente da ps2.0, allora ci sarebbe da attendersi anche differenze vicine al 40-50%, nel caso R420 sia realmente capace di 48 operazioni per ciclo.

R@nda
27-04-2004, 16:22
Insomma mi sa che ci vuole poco a fare 1+1.....anche stavolta Nvidia s'è fatta fregare:O

Aspettiamo,d'accordo,però la vedo molto facile per Ati che aveva un architettura già forte.
Vedremo.

Raven
27-04-2004, 16:42
Come sempre sei un drago nelle spiegazioni, yoss!!! ;)

Sawato Onizuka
27-04-2004, 16:43
http://cgi.ebay.it/ws/eBayISAPI.dll?ViewItem&item=4127408792&category=23885

:eek:

:rotfl: :rotfl: :rotfl:

su partecipate :sofico:

voglio un X800 :cry: (ma prima un toshiba sd-r5272 :D :eek: )

Keyfaiv
27-04-2004, 18:17
Originariamente inviato da yossarian
il mio riferimento era realtivo alla sola esecuzione dei ps2.0 in abbinamento ad operazioni di texture fetch. Non è necessariamente vero che questo si traduca in un analogo gap nelle reali prestazioni, su cui influiscono altri fattori. Crto, in quelle applicazioni in cui la differenza è dattata principalmente da ps2.0, allora ci sarebbe da attendersi anche differenze vicine al 40-50%, nel caso R420 sia realmente capace di 48 operazioni per ciclo.

Notizie che lasciano davvero a bocca aperta... :D e che prestazioni :sofico: La verita', quella "vera" pero', la scopriremo solo testando con i ns occhi, diffidando solo dei bench... e mi verra' da ridere quando uscira' il nuovo e "distruttivo" 3DmurK ;)

Keyfaiv
27-04-2004, 18:31
Originariamente inviato da Adriano77
http://www.driverheaven.net/showthread.phps=&threadid=44253

http://www.driverheaven.net/showthread.php?s=&threadid=44253

Nei test effettuati da Driverheaven nei link appare chiaro come NV40 utilizza in Farcry una sorta di modalita' Mixed sfruttando i pixel shaders 1.1 quando invece andrebbero sfruttati i 2.0

Ati con la 9800XT rispetta pienamente i canoni directx 9 mentre Nvidia con NV40 no, e i drivers forzano la scheda a sfruttare i piu semplici e veloci 1.1 nonostante Farcry richieda i 2.0

Questo e' il tipico esempio che andando a scavare, si trovano svariate magagne... cio' che mi lascia perplesso e' vedero che nvidia non sia riuscita a fare davvero il salto di qualita' che si aspettava... e continuo a non capire perche' intendono continuare a "giocare", usando dei trucchetti stupidi per farsi vedere prestazionali oltre le reali capacita' attuali...
:confused:

shinji_85
27-04-2004, 18:35
Originariamente inviato da Keyfaiv
Notizie che lasciano davvero a bocca aperta... :D e che prestazioni :sofico: La verita', quella "vera" pero', la scopriremo solo testando con i ns occhi, diffidando solo dei bench... e mi verra' da ridere quando uscira' il nuovo e "distruttivo" 3DmurK ;)

Sono d'accordo... Alla fine vorro' vedere come si comportano entrambe le schede e non se una fa o meno 300 pp + dell'altra in un test come 3dmerc03

Veghan
27-04-2004, 19:10
Originariamente inviato da yossarian


Valutando una complessità dei ps2.0 di almeno 4 volte superiore rispetto ai ps1.1 (a livello di pesantezza di calcolo per la gpu e si tratta di una stima approssimata per difetto se si considera anche l'adozione di nuove feature DX9), si vede che, in ogni caso, l'operazione di shder replacement porta dei benefici (anche all'R3x0 ed all'NV40).
Certo, rispetto ai vantaggi che portano alla serie NV3x quelli delle altre due sono molto minori. NV40 ed R3x0 riescono a "maneggiare" piuttosto bene anche i ps20.



Voglevo proporti dei bench di HL2 che all'epoca mi sembrarono molto strani
http://www.tomshw.it/guides/graphic/20030912/images/image005.gif

il comportamento di nv35 è in un certo senso normale, abbiamo capito che utilizzando le dx 9 le performance calano in maniera vistosa, invece R350 che dovrebbe avere un calo seppur limitato si comporta in maniera opposta a quello che credevo, le sue performance aumentano! Secondo te perche accade una cosa simile? forse la maggiore complessità degli shader viene bilanciata dal fatto che altri effetti mediante le dx9 vengono gestiti con maggiore velocità?

halduemilauno
27-04-2004, 19:21
ciao.
http://www.digit-life.com/articles2/gffx/nv40-part1-a.html
;)

halduemilauno
27-04-2004, 19:38
rilancio.
http://www.firingsquad.com/hardware/far_cry_nvidia/default.asp
ciao.
;)

yossarian
27-04-2004, 19:40
Originariamente inviato da Veghan
Voglevo proporti dei bench di HL2 che all'epoca mi sembrarono molto strani
http://www.tomshw.it/guides/graphic/20030912/images/image005.gif

il comportamento di nv35 è in un certo senso normale, abbiamo capito che utilizzando le dx 9 le performance calano in maniera vistosa, invece R350 che dovrebbe avere un calo seppur limitato si comporta in maniera opposta a quello che credevo, le sue performance aumentano! Secondo te perche accade una cosa simile? forse la maggiore complessità degli shader viene bilanciata dal fatto che altri effetti mediante le dx9 vengono gestiti con maggiore velocità?

la serie r3x0, quando lavora con i ps1.x ha in funzione l'equivalente di 4 unità logiche, mentre quando lavora con i ps2.0 ne ha in funzione 16. L'implementazione delle DX9 in HL2 è molto ridotta, utilizza una forma molto light di hdr che non si rifà neppure alle specifiche minime e si limita, per lo più, alla ricompilazione di istruzioni ex DX8.1 in HLSL. In questa situazione, si può assumere, senza perdita di generalità, che le istruzioni ps2.0 siano, in media, alivello di complessità di gestione per la gpu, circa 4 volte più pesanti (la cosa si può, in qualche modo, desumere anche dal numero di registri temporanei di ogni unità ps dell'R200, 6 da 16 bit, e dell'R3x0, 12 da 32 bit.
Quindi, in quel caso, l'R3x0 si comporta esattamente in accordo con la teoria: le prestazioni tra ps1.x e ps2.0 restano pressochè invariate (quella differenza di 0,3 fps è poco indicativa).
Stessa indicazione si ritrova in uno dei bench usati, se non sbaglio, da x-bit labs, in cui, con una 9800xt le prestazioni, passando da ps1.1 a ps2.0 restavano immutate; discorso analogo nel caso di una 9600xt testata con shadermark2.0

fek
27-04-2004, 19:47
Originariamente inviato da yossarian

Stessa indicazione si ritrova in uno dei bench usati, se non sbaglio, da x-bit labs, in cui, con una 9800xt le prestazioni, passando da ps1.1 a ps2.0 restavano immutate; discorso analogo nel caso di una 9600xt testata con shadermark2.0

yoss, credo che il fatto che non ci sia differenza di prestazioni fra un ps1.1 e 2.0 nelle R3X0 sia dovuto al fatto che la GPU non ha un'unita' di esecuzione differente per le differenti versioni, ma "compila" internamente i ps1.x in ps2.0 e attiva una modalita' di emulazione delle istruzioni intere per simulare le limitazioni dei ps1.x.

fek
27-04-2004, 19:49
Originariamente inviato da Veghan forse la maggiore complessità degli shader viene bilanciata dal fatto che altri effetti mediante le dx9 vengono gestiti con maggiore velocità?

Come scrivevo prima il motivo e' presto detto: l'R3X0 ha un "motore" puramente ps2.0 all'interno ed emula i ps1.x traducendoli al volo.

pandyno
27-04-2004, 19:51
Originariamente inviato da fek
yoss, credo che il fatto che non ci sia differenza di prestazioni fra un ps1.1 e 2.0 nelle R3X0 sia dovuto al fatto che la GPU non ha un'unita' di esecuzione differente per le differenti versioni, ma "compila" internamente i ps1.x in ps2.0 e attiva una modalita' di emulazione delle istruzioni intere per simulare le limitazioni dei ps1.x.

Alla faccia... ;)

Thunder82
27-04-2004, 19:53
Originariamente inviato da fek
Come scrivevo prima il motivo e' presto detto: l'R3X0 ha un "motore" puramente ps2.0 all'interno ed emula i ps1.x traducendoli al volo.

Praticamente il contrario delle GF FX che usano i ps1.x per emulare i ps2.0 :sofico:

Scherzo :)

yossarian
27-04-2004, 19:53
Originariamente inviato da fek
yoss, credo che il fatto che non ci sia differenza di prestazioni fra un ps1.1 e 2.0 nelle R3X0 sia dovuto al fatto che la GPU non ha un'unita' di esecuzione differente per le differenti versioni, ma "compila" internamente i ps1.x in ps2.0 e attiva una modalita' di emulazione delle istruzioni intere per simulare le limitazioni dei ps1.x.


in effetti è così; il risultato è che, però, in modalità ps1.x, secondo le staesse specifiche fornite da ATi, il chip è capace di un massimo di 12 operazioni complete per ciclo contro le 24 in modalità ps2.0 (conteggiando anche le texture fetch).
Quindi, all'atto pratico, si comporta come se avesse 4 unità di calcolo in virgola fissa complessive, contro le 16 in virgola mobile (le operazioni sulle texture sono 8 in entrambi i casi).
L'architettura di R3x0 è in realtà una 4+4, poichè utilizza in input due quad, come fa NV40 (che però ne usa 4); con i calcoli in virgola fissa, ogni 4 pipeline si comportano come se avessero, in tutto, 2 unità logiche.
Anche NV40 si comporta così, però ho la sempre più netta sensazione che solo 12 delle pipeline eseguano anche calcoli in virgola fissa, mentre le restanti 4 (che poi sono quelle che saranno disabilitate sulla versione liscia) eseguono solo calcoli in fp.

fek
27-04-2004, 20:09
Originariamente inviato da yossarian
in effetti è così; il risultato è che, però, in modalità ps1.x, secondo le staesse specifiche fornite da ATi, il chip è capace di un massimo di 12 operazioni complete per ciclo contro le 24 in modalità ps2.0 (conteggiando anche le texture fetch).
Quindi, all'atto pratico, si comporta come se avesse 4 unità di calcolo in virgola fissa complessive, contro le 16 in virgola mobile (le operazioni sulle texture sono 8 in entrambi i casi).


Mi spieghi meglio questo passaggio? Ti spiace?

halduemilauno
27-04-2004, 20:09
Originariamente inviato da yossarian
in effetti è così; il risultato è che, però, in modalità ps1.x, secondo le staesse specifiche fornite da ATi, il chip è capace di un massimo di 12 operazioni complete per ciclo contro le 24 in modalità ps2.0 (conteggiando anche le texture fetch).
Quindi, all'atto pratico, si comporta come se avesse 4 unità di calcolo in virgola fissa complessive, contro le 16 in virgola mobile (le operazioni sulle texture sono 8 in entrambi i casi).
L'architettura di R3x0 è in realtà una 4+4, poichè utilizza in input due quad, come fa NV40 (che però ne usa 4); con i calcoli in virgola fissa, ogni 4 pipeline si comportano come se avessero, in tutto, 2 unità logiche.
Anche NV40 si comporta così, però ho la sempre più netta sensazione che solo 12 delle pipeline eseguano anche calcoli in virgola fissa, mentre le restanti 4 (che poi sono quelle che saranno disabilitate sulla versione liscia) eseguono solo calcoli in fp.

scusa ma(se ho capito bene)se fosse cosi la liscia a 12 pipe non esegue o non eseguirebbe calcoli in FP?
visto qui?
http://www.digit-life.com/articles2/gffx/nv40-part1-a.html
ciao Yossi.

:) :)

Thunder82
27-04-2004, 20:16
Originariamente inviato da halduemilauno
scusa ma(se ho capito bene)se fosse cosi la liscia a 12 pipe non esegue o non eseguirebbe calcoli in FP?
visto qui?
http://www.digit-life.com/articles2/gffx/nv40-part1-a.html
ciao Yossi.

:) :)

No, nella 6800U 12 pipe eseguono calcoli in virgola fissa, e 16 in fp (se è esatta la schematizzazione 12+4)

Nella 6800 12 pipe eseguono calcoli in virgola fissa, e 12 in fp

:)

Paoletta Corsini
27-04-2004, 20:20
Originariamente inviato da halduemilauno
scusa ma(se ho capito bene)se fosse cosi la liscia a 12 pipe non esegue o non eseguirebbe calcoli in FP?
Credo che l'ipotesi di yossarian sia da escludere. Se fosse così ci troveremmo di fronte ad una differenzazione dei core, che non riguarda più la mena disattivazione delle pipeline, ma proprio nuovi modi di comportarsi in presenza o meno delle catene di montaggio. E' plausibile che il chip sia tanto complesso da far un auto checkup e di assegnare le pipeline a compiti differenti in base a quanti ne trova attivi? Fantahardware? :)

halduemilauno
27-04-2004, 20:22
Originariamente inviato da Thunder82
No, nella 6800U 12 pipe eseguono calcoli in virgola fissa, e 16 in fp (se è esatta la schematizzazione 12+4)

Nella 6800 12 pipe eseguono calcoli in virgola fissa, e 12 in fp

:)


ok. sempre se è esatta la schematizzazione 12+4. ma mi pare di aver capito dal link postato che non lo è.
ciao.

:) :)

andreamarra
27-04-2004, 20:33
Originariamente inviato da Sawato Onizuka
http://cgi.ebay.it/ws/eBayISAPI.dll?ViewItem&item=4127408792&category=23885

:eek:

:rotfl: :rotfl: :rotfl:

su partecipate :sofico:

voglio un X800 :cry: (ma prima un toshiba sd-r5272 :D :eek: )


:asd: :eek:

Ma già la vogliono sbolognare??? :asd:

yossarian
27-04-2004, 21:04
Originariamente inviato da Paoletta Corsini
Credo che l'ipotesi di yossarian sia da escludere. Se fosse così ci troveremmo di fronte ad una differenzazione dei core, che non riguarda più la mena disattivazione delle pipeline, ma proprio nuovi modi di comportarsi in presenza o meno delle catene di montaggio. E' plausibile che il chip sia tanto complesso da far un auto checkup e di assegnare le pipeline a compiti differenti in base a quanti ne trova attivi? Fantahardware? :)

hai ragione, l'ipotesi parte da un assunto sbagliato, perchè mi ricordavo dati non corretti relativi all'R3x0. Ora che li ho riguardati ho visto che lavorando solo in fx l'R3x0 arriva a 8 operazioni per ciclo; però, poichè il rapporto tra NV40 ed R3x0 è di 3:2, questo significa che l'NV40 ne svolge 12; resta perciò, finora, valida l'ipotesi che solo 12 delle 16 pipeline riescano a lavorare in virgola fissa.
Non si tratta di fantaHW né di avere due linee di produzione; basta che NV40 sia nato già con 12 pipeline complete e 4 operanti solo in fp a livello di progetto. Quindi, partendo da un unico core e disabilitando le 4 pipeline incomplete, si può ottenere un chip a 12 pipeline capaci di lavorare in fp e in fx

yossarian
27-04-2004, 21:13
Originariamente inviato da fek
Mi spieghi meglio questo passaggio? Ti spiace?

ogni pipeline dell'R3x0 ha 3 unità di calcolo; 2 fpu e 1 tmu, tutte indipendenti tra loro.
Quando lavora con calcoli fp e con texture fetch può arrivare quindi a 24 operazioni complessive.
Nel caso di calcoli in virgola fissa, le operazioni complessive sono 12 (come risulta sia dai bench che dalle specifiche tecniche fornite da ATi); ossia da 8 texture fetch e da 4 calcoli in fx. In pratica funziona come se ogni due pipeline abbiano in comune un'unità fx, ipotesi da non escludere, poichè l'architettura dell'R3x0 non è di tipo classica in senso stretto ma presenta vaghi cenni di architettura superscalare (ad esempio le alu non sono le classiche 4 unità fp24 vettoriali, ma delle 3+1, così come le 8 pipeline sono divise in due gruppi da 4 che hanno più di qualche elemento in comune).

fek
27-04-2004, 22:17
Originariamente inviato da yossarian
Nel caso di calcoli in virgola fissa, le operazioni complessive sono 12 (come risulta sia dai bench che dalle specifiche tecniche fornite da ATi); ossia da 8 texture fetch e da 4 calcoli in fx.

Ok, questa e' un'ipotesi quindi?
Non e' possibile che usi due unita' al posto di una proprio per quei problemi di emulazione dei calcoli in virgola fissa dei quali parlavo? Sto ipotizzando selvaggiamente.
Il punto e' che loro mi hanno detto chiaramente che hanno solo ALU in virgola mobile e emulano i calcoli in virgola fissa in qualche modo che non mi hanno specificato.

MaBru
27-04-2004, 22:44
Originariamente inviato da fek
Il punto e' che loro mi hanno detto chiaramente che hanno solo ALU in virgola mobile e emulano i calcoli in virgola fissa in qualche modo che non mi hanno specificato.

Mmmmm...;)

yossarian
27-04-2004, 23:56
Originariamente inviato da fek
Ok, questa e' un'ipotesi quindi?
Non e' possibile che usi due unita' al posto di una proprio per quei problemi di emulazione dei calcoli in virgola fissa dei quali parlavo? Sto ipotizzando selvaggiamente.
Il punto e' che loro mi hanno detto chiaramente che hanno solo ALU in virgola mobile e emulano i calcoli in virgola fissa in qualche modo che non mi hanno specificato.

ok; come non detto; ho riguardato le specifiche ufficiali ATi e con un input di tipo tex/fx l'R3x0 compie 16 operazioni, mentre con un input fp/fp/fx arriva "solo" a 12 operazioni. Quindi c'è una dipendenza, però è relativa all'utilizzo contemporaneo di calcoli in virgola fissa e calcoli in virgola mobile. A questo punto, l'arcano è presto svelato; poichè le alu sono ufficialmente 64 (ossia 16 da fp24 per pipeline, ovvero 2 unità full vect fp96) allora sono queste due che emulano il funzionamento di un'unità fx16.
Di conseguenza, poichè nell'eseguire i soli calcoli in fx l'R3x0 arriva a 8 operazioni per ciclo, dal confronto fatto con i bench sintetici si può concludere che l'NV40 ne compie 12. Resta valida, finora, l'ipotesi che solo 12 delle 16 pipeline integrino funzioni di calcolo fx, mentre le restanti 4 lavorano solo in fp.
Riassumendo, sbagliato il conteggio del numero di alu (reali o "virtuali") in fx, ma corretta, finora, l'ipotesi dell'architettura 12+4

:muro:

crice
28-04-2004, 10:52
grande figura da parte di nvidia.....riusciranno mai ad avere una politica corretta??? o continueranno a provare a infinocchiare i propri utenti, sempre e comunque , pur di poter dire di essere i migliori....

JENA PLISSKEN
28-04-2004, 11:17
Originariamente inviato da yossarian
ok; come non detto; ho riguardato le specifiche ufficiali ATi e con un input di tipo tex/fx l'R3x0 compie 16 operazioni, mentre con un input fp/fp/fx arriva "solo" a 12 operazioni. Quindi c'è una dipendenza, però è relativa all'utilizzo contemporaneo di calcoli in virgola fissa e calcoli in virgola mobile. A questo punto, l'arcano è presto svelato; poichè le alu sono ufficialmente 64 (ossia 16 da fp24 per pipeline, ovvero 2 unità full vect fp96) allora sono queste due che emulano il funzionamento di un'unità fx16.
Di conseguenza, poichè nell'eseguire i soli calcoli in fx l'R3x0 arriva a 8 operazioni per ciclo, dal confronto fatto con i bench sintetici si può concludere che l'NV40 ne compie 12. Resta valida, finora, l'ipotesi che solo 12 delle 16 pipeline integrino funzioni di calcolo fx, mentre le restanti 4 lavorano solo in fp.
Riassumendo, sbagliato il conteggio del numero di alu (reali o "virtuali") in fx, ma corretta, finora, l'ipotesi dell'architettura 12+4

:muro:

Cioè...un attimo...cosa mi sono perso in questi 2 gg?? In pratica l' NV 40 va a@12 + 4????
:confused: :confused: :confused: :confused: :confused: :confused: :confused: :confused: :confused:

fek
28-04-2004, 12:19
Originariamente inviato da yossarian
ok; come non detto; ho riguardato le specifiche ufficiali ATi e con un input di tipo tex/fx l'R3x0 compie 16 operazioni, mentre con un input fp/fp/fx arriva "solo" a 12 operazioni. Quindi c'è una dipendenza, però è relativa all'utilizzo contemporaneo di calcoli in virgola fissa e calcoli in virgola mobile. A questo punto, l'arcano è presto svelato; poichè le alu sono ufficialmente 64 (ossia 16 da fp24 per pipeline, ovvero 2 unità full vect fp96) allora sono queste due che emulano il funzionamento di un'unità fx16.
Di conseguenza, poichè nell'eseguire i soli calcoli in fx l'R3x0 arriva a 8 operazioni per ciclo, dal confronto fatto con i bench sintetici si può concludere che l'NV40 ne compie 12. Resta valida, finora, l'ipotesi che solo 12 delle 16 pipeline integrino funzioni di calcolo fx, mentre le restanti 4 lavorano solo in fp.
Riassumendo, sbagliato il conteggio del numero di alu (reali o "virtuali") in fx, ma corretta, finora, l'ipotesi dell'architettura 12+4

:muro:

Perfetto... fila tutto liscio con quello che mi hanno detto loro :)

yossarian
28-04-2004, 13:28
Originariamente inviato da fek
Perfetto... fila tutto liscio con quello che mi hanno detto loro :)


scusami caro, mi ero basato su ricordi di gioventù, però ho la memoria che inizia a perdere colpi; per fortuna ho potuto dare un'occhiata alle specifiche ATi (qui non si butta neinte, magari si fa fatica a trovare le cose a causa del disordine :D )

;)

yossarian
28-04-2004, 13:36
Originariamente inviato da JENA PLISSKEN
Cioè...un attimo...cosa mi sono perso in questi 2 gg?? In pratica l' NV 40 va a@12 + 4????
:confused: :confused: :confused: :confused: :confused: :confused: :confused: :confused: :confused:


secondo i miei calcoli, l'NV40 quando lavora in virgola fissa ha un rapporto di 3:2 rispetto ad R360, circa a parità di frequenza. POichè R360 ha le 2 fpu di ogni pipeline che emulano il funzionamento di una unità fx, quindi dispone di 8 unità di calcolo in virgola fissa teoriche, allora si può ipotizzare che lo stesso avvenga su NV40, però limitatamente a 12 delle 16 pipeline, in maniera che si abbia un rapporto di 12:8, ossia 3:2.
Anche la presenza di 6 unità VS lascerebbe pensare ad un'architettura che sia nata come una sorta di 12+4, con 12 pipeline "complete" che eseguono calcoli sia in fp che in fx e le altre 4 (che dovrebbero essere quelle disabilitate sulla liscia e su una eventuale pro) che lavorano solo in fp.
Le motivazioni potrebbero essere diverse; una è che è nata, inizialmente, come una 12x1 e si è pensato in un secondo tempo di integrare le altre 4 pipeline, avendo constatato che c'era ancora un po' di spazio sufficiente per farlo; un'altra è che il progetto iniziale prevedeva proprio qualcosa del genere, poichè non c'era spazio sufficiente per inserire altre 4 pipeline "complete" e si è pensato di sacrificare qualcosa là dove si pensava di poterlo fare.

Crisidelm
28-04-2004, 14:50
Propendo per la seconda ipotesi...

zerothehero
28-04-2004, 14:57
Originariamente inviato da yossarian
si, però il 20% dovrebbe essere la differenza se si usasse una path ps2.0 pura; nel caso di farcry mi aspetto, con i prossimi driver, qualche punto in più per l'NV40 (non i 60 fps visti con la path NV, ma qualcosa di meglio dei 48-49 della path definita R3x0).
Con path interamente dx9, purtroppo, ripeto, la dipendenza tra fpu e tmu può essere un handicap.


Così poca differenza tra 6800 ultra e 9800xt nei ps2.0?:confused:

io ancora non capisco perchè l'nvidia non faccia girare solo a 24/32 fp quale è il motivo? vogliono farsi male da soli?:(

crice
28-04-2004, 15:10
saranno masochisti...

yossarian
28-04-2004, 15:10
Originariamente inviato da zerothehero
Così poca differenza tra 6800 ultra e 9800xt nei ps2.0?:confused:


la dipendenza tra fpu e tmu purtroppo frena le prestazioni dell'NV40. Ogni pipeline di renderig dispone, infatti, di 3 unità di calcolo complete (2 alu e 1 tmu); 2 di queste (la prima delle 2 alu e la tmu) non possone essere usate in contemporanea (come avveniva anche per la serie NV3x); questo riduce, in ogni caso, il numero massimo possibile delle operazioni, da 48 (16*3) a 32 (16*2) per ciclo di clock.
L'R3x0 ha, su ogni pipeline, 2 alu e 1 tmu (come NV40), però sono tutte indipendenti.
Questo significa che il picco massimo raggiungibile è di 24 operazioni per ciclo, quindi il rapporto tra le capacità di calcolo teoriche di NV40 ed R360 è di 4:3, il che dà un 25% di vantaggio all'NV40, che diventa un 22% circa, nel momento in cui si tiene conto anche delle attuali frequenze di clock (412 per R360 e 400 Mhz per NV40), quando si utilizzano i ps2.0
Il problema non è 24, 32 o 16 bit, ma la dipendenza tra prima alu e tmu (non mi spiego per quale motivo non sia stata eliminata, visto che già frenava le prestazioni dell'NV3x).

zerothehero
28-04-2004, 15:24
Originariamente inviato da yossarian
la dipendenza tra fpu e tmu purtroppo frena le prestazioni dell'NV40. Ogni pipeline di renderig dispone, infatti, di 3 unità di calcolo complete (2 alu e 1 tmu); 2 di queste (la prima delle 2 alu e la tmu) non possone essere usate in contemporanea (come avveniva anche per la serie NV3x); questo riduce, in ogni caso, il numero massimo possibile delle operazioni, da 48 (16*3) a 32 (16*2) per ciclo di clock.
L'R3x0 ha, su ogni pipeline, 2 alu e 1 tmu (come NV40), però sono tutte indipendenti.
Questo significa che il picco massimo raggiungibile è di 24 operazioni per ciclo, quindi il rapporto tra le capacità di calcolo teoriche di NV40 ed R360 è di 4:3, il che dà un 25% di vantaggio all'NV40, che diventa un 22% circa, nel momento in cui si tiene conto anche delle attuali frequenze di clock (412 per R360 e 400 Mhz per NV40), quando si utilizzano i ps2.0
Il problema non è 24, 32 o 16 bit, ma la dipendenza tra prima alu e tmu (non mi spiego per quale motivo non sia stata eliminata, visto che già frenava le prestazioni dell'NV3x).
?
tmu=texture memory unit quindi servirebbe per visualizzare le texture....l'alu invece processa i dati? mi spieghi un attimo? ......

quindi in termini utilitaristici è possibile che r420 con 12 pipeline con tmu e alu indipendenti possa essere veloce come un 6800 ultra?

Thunder82
28-04-2004, 15:25
Originariamente inviato da yossarian
la dipendenza tra fpu e tmu purtroppo frena le prestazioni dell'NV40. Ogni pipeline di renderig dispone, infatti, di 3 unità di calcolo complete (2 alu e 1 tmu); 2 di queste (la prima delle 2 alu e la tmu) non possone essere usate in contemporanea (come avveniva anche per la serie NV3x); questo riduce, in ogni caso, il numero massimo possibile delle operazioni, da 48 (16*3) a 32 (16*2) per ciclo di clock.
L'R3x0 ha, su ogni pipeline, 2 alu e 1 tmu (come NV40), però sono tutte indipendenti.
Questo significa che il picco massimo raggiungibile è di 24 operazioni per ciclo, quindi il rapporto tra le capacità di calcolo teoriche di NV40 ed R360 è di 4:3, il che dà un 25% di vantaggio all'NV40, che diventa un 22% circa, nel momento in cui si tiene conto anche delle attuali frequenze di clock (412 per R360 e 400 Mhz per NV40), quando si utilizzano i ps2.0
Il problema non è 24, 32 o 16 bit, ma la dipendenza tra prima alu e tmu (non mi spiego per quale motivo non sia stata eliminata, visto che già frenava le prestazioni dell'NV3x).

Ma perchè, mi chiedo io, nVidia non ha risolto questo problema che già era presente in NV30? Il tempo l'hanno avuto mi pare :confused:

yossarian
28-04-2004, 15:28
Originariamente inviato da zerothehero
tmu=texture memory unit quindi servirebbe per visualizzare le texture....l'alu invece processa i dati? ......

quindi in termini utilitaristi è possibile che r420 con 12 pipeline con tmu e alu indipendenti possa essere veloce come un 6800 ultra?

a livello di capacità di calcolo, almeno limitatamente ai soli ps2.0, in caso di utilizzo contemporaneo di 2 istruzioni matematiche e di una texture fetch, l'R420 pro, con 12 pipeline (se le unità fossero indipendenti, come sembra da qualche test fatto con path ps2.0 only, con cui una X800XT va esattamente il doppio rispetto ad un R360), sarebbe capace di un massimo di 36 operazioni per ciclo: quindi sarebbe più veloce della 6800 ultra (tenendo conto, in più, anche delle frequenze superiori).
Questo, ovviamente, se le prime impressioni sull'R420 sono confermate

yossarian
28-04-2004, 15:39
Originariamente inviato da Thunder82
Ma perchè, mi chiedo io, nVidia non ha risolto questo problema che già era presente in NV30? Il tempo l'hanno avuto mi pare :confused:


bella domanda, a cui però non so darti una risposta. L'unica cosa che posso dirti è che questa dipendenza dipende dall'uso di parte della circuiiteria in comune; sicuramente almeno i registri temporanei sono in comune tra alu e tmu (il che già rende inutilizzabile una quando è in funzione l'altra). Forse il problema è lo spazio, anche in questo caso; nVIDIA ha optato, già con NV3x per una pipeline con più elementi rispetto a quella di ATi, con due punti di uscita verso il frame buffer che comportano, però una ridondanza negli elementi di calcolo utilizzati (in pratica alcuni sono doppi). Questo per avere la possibilità di avere in uscita 8 pixel con l'NV3x e 32 con l'NV40 quando si utilizzano solo dati relativi allo z-buffer. Non so perchè abbia fatto questa scelta; pare che sia una feature utilizzata nel motore grafico di Doom3.

Thunder82
28-04-2004, 15:48
Originariamente inviato da yossarian
bella domanda, a cui però non so darti una risposta. L'unica cosa che posso dirti è che questa dipendenza dipende dall'uso di parte della circuiiteria in comune; sicuramente almeno i registri temporanei sono in comune tra alu e tmu (il che già rende inutilizzabile una quando è in funzione l'altra). Forse il problema è lo spazio, anche in questo caso; nVIDIA ha optato, già con NV3x per una pipeline con più elementi rispetto a quella di ATi, con due punti di uscita verso il frame buffer che comportano, però una ridondanza negli elementi di calcolo utilizzati (in pratica alcuni sono doppi). Questo per avere la possibilità di avere in uscita 8 pixel con l'NV3x e 32 con l'NV40 quando si utilizzano solo dati relativi allo z-buffer. Non so perchè abbia fatto questa scelta; pare che sia una feature utilizzata nel motore grafico di Doom3.

Probabilmente verrà premiata appunto quando i giochi (doom3 in primis) si appoggeranno completamente alle stencil shadow, la relativa inefficienza nei ps 2.0 potrebbe essere compensata da questo aspetto :)

(perchè non è che i giochi siano solo ps 2.0, magari un'architettura è debole in un punto ma forte in un altro, e le 2 cose si compensano riuscendo ad ottenere una buona media :p )

Jedi_Master
28-04-2004, 15:50
Originariamente inviato da yossarian
Non so perchè abbia fatto questa scelta; pare che sia una feature utilizzata nel motore grafico di Doom3.

Magari convinti che mezzo mondo avrebbe utilizzato
quel motore grafico invece di farsene uno proprio.....
:confused:
Secondo te e' possibile che la gestione della doppia
modalita' 16/32 abbia complicato ulteriormente le cose?

yossarian
28-04-2004, 15:57
Originariamente inviato da Jedi_Master
Magari convinti che mezzo mondo avrebbe utilizzato
quel motore grafico invece di farsene uno proprio.....
:confused:
Secondo te e' possibile che la gestione della doppia
modalita' 16/32 abbia complicato ulteriormente le cose?

no, perchè a livello di circuiteria cambia poco o niente; il numero minimo di registri previsti dai PS2.0 è basato sull'utilizzo dell'fp32 (fp24 come minima precisione di calcolo richiesta), quello dei ps3.0 anche; un'unità che lavora in fp32 è in grado di farlo anche in fp16 (è solo il controler che la gestisce in maniera differente).
Quindi, a livello di HW, le differenze non sono così rilevanti. A livello di calcolo, ovviamente, la gestione dell'fp32 è più difficoltosa di quella dell'fp16; però non bisogna dimenticare che le pessime prestazioni della serie NV3x con fp32 non era dovuta tanto alla maggior complessità dei calcoli quanto all'utilizzo din un numero di registri temporanei minimo addirittura al di sotto di quello previsto dalle specifiche ps2.0, che obbliga il chip a compiere, in molti casi, in due cicli un'elaborazione che potrebbe compiere in un solo ciclo.
Con NV40, almeno dai primi riscontri (bench sintetici con ps2.0 pp e ps2.0 simple), pare che non sia stato commesso lo stesso errore

Thunder82
28-04-2004, 16:01
Originariamente inviato da yossarian
no, perchè a livello di circuiteria cambia poco o niente; il numero minimo di registri previsti dai PS2.0 è basato sull'utilizzo dell'fp32 (fp24 come minima precisione di calcolo richiesta), quello dei ps3.0 anche; un'unità che lavora in fp32 è in grado di farlo anche in fp16 (è solo il controler che la gestisce in maniera differente).
Quindi, a livello di HW, le differenze non sono così rilevanti. A livello di calcolo, ovviamente, la gestione dell'fp32 è più difficoltosa di quella dell'fp16; però non bisogna dimenticare che le pessime prestazioni della serie NV3x con fp32 non era dovuta tanto alla maggior complessità dei calcoli quanto all'utilizzo din un numero di registri temporanei minimo addirittura al di sotto di quello previsto dalle specifiche ps2.0, che obbliga il chip a compiere, in molti casi, in due cicli un'elaborazione che potrebbe compiere in un solo ciclo.
Con NV40, almeno dai primi riscontri (bench sintetici con ps2.0 pp e ps2.0 simple), pare che non sia stato commesso lo stesso errore

Ma nV40 quando va in fp16 usa i registri da 32bit come se fossero 2 registri da 16bit vero? O meglio, ha solo registri da 16bit che possono essere "concatenati" per formare registri da 32?

Perchè alle superiori facevo Assembler sul motorola 6809, processore a 8 bit, ma aveva 2 registri a 8 bit che potevano essere "concatenati" per formare un registro a 16bit :)

yossarian
28-04-2004, 16:10
Originariamente inviato da Thunder82
Ma nV40 quando va in fp16 usa i registri da 32bit come se fossero 2 registri da 16bit vero? O meglio, ha solo registri da 16bit che possono essere "concatenati" per formare registri da 32?

Perchè alle superiori facevo Assembler sul motorola 6809, processore a 8 bit, ma aveva 2 registri a 8 bit che potevano essere "concatenati" per formare un registro a 16bit :)

NV3x utilizza registri da 8 bit concatenai (per l'esattezza, ha 32 registri temporanei da 8 bit), R3x0 ne utilizza 12 da 16 bit.
Su NV40, che io sappia, si utilizzano ancora registri da 8 bit

Thunder82
28-04-2004, 16:15
Originariamente inviato da yossarian
NV3x utilizza registri da 8 bit concatenai (per l'esattezza, ha 32 registri temporanei da 8 bit), R3x0 ne utilizza 12 da 16 bit.
Su NV40, che io sappia, si utilizzano ancora registri da 8 bit

Solo registri da 8 bit? Urca, siamo ai livelli del 6809, processore del 1982 se non erro :sofico:

Thunder82
28-04-2004, 16:18
Ma adesso sorge il dubbio: se ATi ha solo registri da 16bit, da dove lo tira fuori il fp24? Usa un registro e mezzo? Oppure 3 registri per immagazzinare 2 dati fp24? (2x24=48=3x16) Con registri a 8bit sarebbero occorsi 3 registri per un dato in fp24...

Jedi_Master
28-04-2004, 16:24
Originariamente inviato da yossarian
però non bisogna dimenticare che le pessime prestazioni della serie NV3x con fp32 non era dovuta tanto alla maggior complessità dei calcoli quanto all'utilizzo din un numero di registri temporanei minimo addirittura al di sotto di quello previsto dalle specifiche ps2.0, che obbliga il chip a compiere, in molti casi, in due cicli un'elaborazione che potrebbe compiere in un solo ciclo.


Si mi ricordavo del problema dei registi,
e da come dicevi nel post prima il problema e' + o -
sempre quello, solo che stavolta sono pochi xche'
sono usati in comune da alu e tmu.
Mi chiedo, ma con 220 milioni di transistor e' strano il
dover ricorrere all'uso in comune di parte dei circuiti.

JENA PLISSKEN
28-04-2004, 16:26
Originariamente inviato da yossarian
secondo i miei calcoli, l'NV40 quando lavora in virgola fissa ha un rapporto di 3:2 rispetto ad R360, circa a parità di frequenza. POichè R360 ha le 2 fpu di ogni pipeline che emulano il funzionamento di una unità fx, quindi dispone di 8 unità di calcolo in virgola fissa teoriche, allora si può ipotizzare che lo stesso avvenga su NV40, però limitatamente a 12 delle 16 pipeline, in maniera che si abbia un rapporto di 12:8, ossia 3:2.
Anche la presenza di 6 unità VS lascerebbe pensare ad un'architettura che sia nata come una sorta di 12+4, con 12 pipeline "complete" che eseguono calcoli sia in fp che in fx e le altre 4 (che dovrebbero essere quelle disabilitate sulla liscia e su una eventuale pro) che lavorano solo in fp.
Le motivazioni potrebbero essere diverse; una è che è nata, inizialmente, come una 12x1 e si è pensato in un secondo tempo di integrare le altre 4 pipeline, avendo constatato che c'era ancora un po' di spazio sufficiente per farlo; un'altra è che il progetto iniziale prevedeva proprio qualcosa del genere, poichè non c'era spazio sufficiente per inserire altre 4 pipeline "complete" e si è pensato di sacrificare qualcosa là dove si pensava di poterlo fare.

Quindi se il 420 avrà 16 pipe in full fx\fp...ne vedremo delle belle...mah, già avevo giudicato questa scheda un qualcosa di NN innovativo, soprattutto dal punto di vista della qualitàed in fin dei conti una scheda snza infamia e sanza lodo
:rolleyes: :rolleyes: , se questo è vero alla NV sarebbero dei pazzi...resta cmq il fatto che loro badano e soprattutto spendono molto x un supporto diretto dei giochi...fra poco spenderanno + in quello che nell' innovazione tecnologica:D :D :D

yossarian
28-04-2004, 16:27
Originariamente inviato da Thunder82
Ma adesso sorge il dubbio: se ATi ha solo registri da 16bit, da dove lo tira fuori il fp24? Usa un registro e mezzo? Oppure 3 registri per immagazzinare 2 dati fp24? (2x24=48=3x16) Con registri a 8bit sarebbero occorsi 3 registri per un dato in fp24...


si, in effetti la scelta di ATi è alquanto strana; però si tenga conto che in molte circostanze i progettisti sono piuttosto conservatori; i registri a 16 bit li hanno ereditati dall'R200 (che aveva 6 registi temporanei a 16 bit appunto); l'R3x0 utilizza 3 registri per ottenere 2 dati in fp24 nelle alu. Le tmu, però, lavorano a fp16/fp32
Invece NV ha ereditato i registri a 8 bit dalla serie NV2x.

JENA PLISSKEN
28-04-2004, 16:27
Originariamente inviato da Thunder82
Ma adesso sorge il dubbio: se ATi ha solo registri da 16bit, da dove lo tira fuori il fp24? Usa un registro e mezzo? Oppure 3 registri per immagazzinare 2 dati fp24? (2x24=48=3x16) Con registri a 8bit sarebbero occorsi 3 registri per un dato in fp24...

Bella domanda...qualcuno sa qualcosa??:confused:

yossarian
28-04-2004, 16:33
Originariamente inviato da Jedi_Master
Si mi ricordavo del problema dei registi,
e da come dicevi nel post prima il problema e' + o -
sempre quello, solo che stavolta sono pochi xche'
sono usati aa alu e tmu.
Mi chiedo, ma con 220 milioni di transistor e' strano il
dover ricorrere all'uso in comune di parte dei circuiti.

come ho detto prima, NV ha scelto di raddoppiare parte della pipeline, per ottenere la modalità 32x0 (8x0 nell'NV30); questo ha comportato l'utilizzo di un bel po' di transistor in più rispetto alla concorrenza.

yossarian
28-04-2004, 16:39
Originariamente inviato da JENA PLISSKEN
Quindi se il 420 avrà 16 pipe in full fx\fp...ne vedremo delle belle...mah, già avevo giudicato questa scheda un qualcosa di NN innovativo, soprattutto dal punto di vista della qualitàed in fin dei conti una scheda snza infamia e sanza lodo
:rolleyes: :rolleyes: , se questo è vero alla NV sarebbero dei pazzi...resta cmq il fatto che loro badano e soprattutto spendono molto x un supporto diretto dei giochi...fra poco spenderanno + in quello che nell' innovazione tecnologica:D :D :D

dal punto di vista dell'architettura, le uniche innovazioni dell'NV40 riguardano la configurazione di tipo superscalare della parte della pipeline di rendering che contiene alu e tmu, che per il numero e la tipologia delle unità di calcolo, è chiaramente di derivazione R300; così come deriva dall'R3x0 la sezione dei VS; le uniche novità, peraltro obbligatorie per soddisfare i requisiti degli shader 3.0, l'introduzione della texture unit all'interno dei VS e della branch unit a valle delle unità VS e della seconda alu della pipeline di rendering. Invece l'altra parte della pipleine di rendering, quella relativa alle z-operations alle colour operations ecc, è di derivazione NV3x.

Jedi_Master
28-04-2004, 16:41
Originariamente inviato da yossarian
come ho detto prima, NV ha scelto di raddoppiare parte della pipeline, per ottenere la modalità 32x0 (8x0 nell'NV30); questo ha comportato l'utilizzo di un bel po' di transistor in più rispetto alla concorrenza.

E se e' vero che piu' sono i transistor, maggiore
e' il calore prodotto.......si abbassano anche
le frequenze massime di funzionamento......
Insomma la vedo un po' triste x nvidia.
A meno che Doom 3 non fa' un botto clamoroso.
:)

crice
28-04-2004, 16:47
se anche fosse il giudizio sulla scheda e sulla sua architettura rimarrebbe sempre il medesimo...cioè un'altra 1/2 delusione

yossarian
28-04-2004, 16:50
Originariamente inviato da Jedi_Master
E se e' vero che piu' sono i transistor, maggiore
e' il calore prodotto.......si abbassano anche
le frequenze massime di funzionamento......
Insomma la vedo un po' triste x nvidia.
A meno che Doom 3 non fa' un botto clamoroso.
:)


stavolta NV non potrà contare sul vantaggio dato da frequenze più alte; il low-k dovrebbe avvantaggiare ATi di un buon 20% circa, da questo punto di vista. Personalmente non ho mai dato credito a "sparate" tipo i 600 Mhz di core per la NV40. Con i prossimi step si potrà ancora guadagnare qualcosa, però più un chip è complesso meno sale in frequenza. Non credo che riuscirà neppure ad avvicinarsi alle frequenze dell'NV38 (che è pure a 0.13 u)
La battaglia va combattuta sul piano della miglior architettura.

yossarian
28-04-2004, 16:52
Originariamente inviato da crice
se anche fosse il giudizio sulla scheda e sulla sua architettura rimarrebbe sempre il medesimo...cioè un'altra 1/2 delusione


a me, personalmente, non dispiace; rispetto ad NV30 è su un altro pianeta e propone qualche anticipazione di quelle che saranno le future architetture delle gpu (il modello superscalare, anche se in forma piuttosto limitata). C'è ancora qualcosa da correggere, però è un buon punto di partenza per i prossimi sviluppi. ATi, da questo punto di vista, è partita in vantaggio. Non è un caso che buona parte dell'architettura dell'NV40 si ispiri all'R300.

Jedi_Master
28-04-2004, 16:59
Sarebbe a nostro vantaggio se decidessero di giocarsela
sul prezzo, visto che comunque va' ben + di una 9800XT.
Ma credo che il marketing non lo permettera' mai!
:(

Keyfaiv
28-04-2004, 17:29
Originariamente inviato da Thunder82
Solo registri da 8 bit? Urca, siamo ai livelli del 6809, processore del 1982 se non erro :sofico:

Quando un'idea e' buona la si ricicla per il maggior numero di volte, fino a quando non se ne puo' + fare a -
:D

zerothehero
28-04-2004, 18:11
Originariamente inviato da Jedi_Master
Sarebbe a nostro vantaggio se decidessero di giocarsela
sul prezzo, visto che comunque va' ben + di una 9800XT.
Ma credo che il marketing non lo permettera' mai!
:(

Va bè considera però che + del prezzo di una 9800xt queste schede non potranno venderle...almeno credo

halduemilauno
29-04-2004, 15:43
aggiornamentino.
http://www.guru3d.com/news.php#1412
ciao.
;)

zerothehero
29-04-2004, 18:33
si sa qualcosa sull' nv 60? :D :D :D :D :sofico: :sofico:

goldorak
29-04-2004, 18:35
Originariamente inviato da zerothehero
si sa qualcosa sull' nv 60? :D :D :D :D :sofico: :sofico:

Ti sei perso l'nv50 per strada ? :sofico: :D

zerothehero
29-04-2004, 18:50
Originariamente inviato da goldorak
Ti sei perso l'nv50 per strada ? :sofico: :D


ho letto che sull'articolo postato da hal dell'nv 60...e ora pretenderei delle specifiche tecniche :O :sofico:

halduemilauno
29-04-2004, 19:03
Originariamente inviato da zerothehero
ho letto che sull'articolo postato da hal dell'nv 60...e ora pretenderei delle specifiche tecniche :O :sofico:


uscirà fra due anni sarà un 1000/2000, 32/64 pipe, 512/1024 di bus.
ciao.
:D :D

MaBru
29-04-2004, 19:17
Intervista alla Crytek su SM2.0 vs SM3.0

1) As a developer, what are the most convincing arguments for the use of Shader 3.0 over 2.0?

· In VS3.0 shader model actually is possible to support general displacement mapping (with smart shader design when vertex shader has to do something during waiting for texture access).

· In PS3.0 shaders it’s possible to decrease number of shaders using dynamic branching (single shader for general lighting) and in such way decrease number of shader switches, passes, and as result increase speed, and also we can utilize dynamic conditional early reject for some cases in both PS and VS and this also will increase speed. As to NV40 generally possible to use co-issues better to take advantage of super-scalar architecture (we can execute 4 instructions per cycle in a single pipeline).

· We can handle several light sources in single pixel shaders by using dynamic loops in PS3.0.

· We can decrease number of passes for 2-sided lighting using additional face register in PS3.0.

· We can use geometry instancing to decrease number of draw-calls (remove CPU limitations as much as possible).

· We can use unrestricted dependent texture read capabilities to produce more advanced post-processing effects and other in-game complex particles/surfaces effects (like water).

· We can use full swizzle support in PS3.0 to make better instructions co-issue and as result speedup performance.

· We can take advantage of using 10 texture interpolators in PS3.0 shader model to reduce number of passes in some cases.

2) As a developer, do you see any compromises or negative aspects resulting from the use of Shader 3.0 over 2.0?

3.0 shader model is just extension to 2.0 shader model. It means it’s possible to compile PS2.0 shader as PS3.0 shader target and it still remains 2.0 compliant shader from the hardware side. Several new features in 3.0 shader model aren’t for free. Texture access in vertex shader is expensive, dynamic branching is not for free. So if developer has to utilize some features of PS3.0 shader model he/she should design shader in way which will remove other much important bottlenecks of application (CPU limitations, states/shaders changing, make shorter shader execution path, decrease streams bandwidth…).

3) Was Crytek or any of its employees paid by NVIDIA to present at the launch event for the GeForce 6800 series?

I wish we would have got some Ferraris :D but nope!

4) Will we see an update for FarCry which enables Shader 3.0? If so, will this be for the entire game or for specific new maps? If a patch enabling Shader 3.0 in FarCry is pending, when can we expect to see it available?

Stay tuned.

5) Is Crytek planning on implementing Shader 3.0 on any/all titles following FarCry or is the company “testing the waters”?

In future generally for all new titles. We don’t have to test water, we know its warm there :D

6) For the screenshot examples shown at the launch event, why was PS 1.1 used to contrast PS 3.0? Why wasn’t a PS 2.0 screenshot compared to PS 3.0 instead?

On the event PS1.1 was compared with PS2.0/PS3.0. We don’t use PS3.0 everywhere. The general rule is to use as lower shader version as possible. So PS3.0 could be used only in several critical places where it gives performance boost.

7) What aspects of the screenshots seen at the launch event are specific examples of the flexibility and power of Shader 3.0?

In current engine there are no visible difference between PS2.0 and PS3.0. PS3.0 is used automatically for per-pixel lighting depending on some conditions to improve speed of rendering.

8) Is the same level of image quality seen when using Shader 3.0 possible using Shader 2.0? If so, what dictates which Shader you decide to use?

In current generation engine quality of PS3.0 is almost the same as PS2.0. PS3.0 is used for performance optimisation purposes.

9) What is your opinion on 64-bit blending and filtering. Do you feel there are cases where it will make a difference to gamers?

64-bit blending and filtering can be used for HDR Rendering and also for soft shadows and other special effects such as Depth of Field. Beside this it is also useful for SAT texture mapping (Summed Area Tables). In video-games using of HDR & DOF will enable us to render real-time scenes very close to movie production quality which will increase realism in the imagery.

http://www.pcper.com/article.php?aid=36&type=expert

Paoletta Corsini
30-04-2004, 01:15
Originariamente inviato da halduemilauno
uscirà fra due anni sarà un 1000/2000, 32/64 pipe, 512/1024 di bus.
ciao.
:D :D
:confused:

andreamarra
30-04-2004, 01:52
Originariamente inviato da MaBru
Intervista alla Crytek su SM2.0 vs SM3.0



http://www.pcper.com/article.php?aid=36&type=expert

Vorrei capire una cosuccia... ma in pratica quegli shot (che aveva postato Psiche tempo fa) fanno vedere la differenza (paurosa..) tra ps.2.0 e ps.3.0... vedo che si parla che la nvidia con il nv40 ha questi ps.3.0 e la ati no...

Esatto?

Ma hanno un rovescio della medaglia questi ps.3.0? Lo chiedo perchè mi incuriosisce che la ati non li supporti.

yossarian
30-04-2004, 02:29
Originariamente inviato da andreamarra
Vorrei capire una cosuccia... ma in pratica quegli shot (che aveva postato Psiche tempo fa) fanno vedere la differenza (paurosa..) tra ps.2.0 e ps.3.0... vedo che si parla che la nvidia con il nv40 ha questi ps.3.0 e la ati no...

Esatto?

Ma hanno un rovescio della medaglia questi ps.3.0? Lo chiedo perchè mi incuriosisce che la ati non li supporti.

gli shot di cui parli, in realtà, non mostravano affatto la differenza qualitativa tra ps2.0 e ps3.0 del tutto inesistente, ma la differenza, secondo varie fonti, tra i ps1.1 e i ps3.0 (e, aggiungo io, con molta probabilità negli shot presi con ps1.1 anche con un livello di dettagli inferiore).

L'unico vantaggio teorico (e solo sul piano delle prestazioni e non della qualità) dei ps3.0 rispetto ai 2.0 è il dynamic branching, a detta di diversi programmatori molto difficile da adoperare sull'HW attuale (NV40 e R420). Poi c'è ovviamente il discorso sulla diversa precisione nei calcoli; l'fp32 può portare qualche vantaggio solo con shader molto lunghi (e anche questo è praticamente inutilizzato, tanto che si ricorre spesso e volentieri ancora all'fp16 quando si fa uso di ps2.0.
Ci sono poi le novità introdotte dai VS3.0; in questo caso, a parte il solito dynamic branching, pare che le altre siano tutte supportate dall'R420.

Paoletta Corsini
30-04-2004, 02:40
Originariamente inviato da yossarian
gli shot di cui parli, in realtà, non mostravano affatto la differenza qualitativa tra ps2.0 e ps3.0 del tutto inesistente, ma la differenza, secondo varie fonti, tra i ps1.1 e i ps3.0 (e, aggiungo io, con molta probabilità negli shot presi con ps1.1 anche con un livello di dettagli inferiore).
Anche secondo me, è impossibile che quei test sia stati effettuati con la medesima qualità.
Ho letto da più fonti che PS2.0 e PS3.0 non cambino qualitivamente, ma quest'ultimo riesce ad eseguire le stesse istruzioni in un unico ciclo di clock, confermi?

andreamarra
30-04-2004, 02:41
Originariamente inviato da yossarian
gli shot di cui parli, in realtà, non mostravano affatto la differenza qualitativa tra ps2.0 e ps3.0 del tutto inesistente, ma la differenza, secondo varie fonti, tra i ps1.1 e i ps3.0 (e, aggiungo io, con molta probabilità negli shot presi con ps1.1 anche con un livello di dettagli inferiore).

L'unico vantaggio teorico (e solo sul piano delle prestazioni e non della qualità) dei ps3.0 rispetto ai 2.0 è il dynamic branching, a detta di diversi programmatori molto difficile da adoperare sull'HW attuale (NV40 e R420). Poi c'è ovviamente il discorso sulla diversa precisione nei calcoli; l'fp32 può portare qualche vantaggio solo con shader molto lunghi (e anche questo è praticamente inutilizzato, tanto che si ricorre spesso e volentieri ancora all'fp16 quando si fa uso di ps2.0.
Ci sono poi le novità introdotte dai VS3.0; in questo caso, a parte il solito dynamic branching, pare che le altre siano tutte supportate dall'R420.

grazie :)

In pratica la scheda ati non potrà fregiarsi del titolo di full optimized ps3.0 a causa della mancanza del dynamic branching. Che nvidia ha. Però la differenza (teorica) sarebbe solo nelle prestazioni e non nelle qualità. Ho capito bene :) ?

yossarian
30-04-2004, 02:52
Originariamente inviato da andreamarra
grazie :)

In pratica la scheda ati non potrà fregiarsi del titolo di full optimized ps3.0 a causa della mancanza del dynamic branching. Che nvidia ha. Però la differenza (teorica) sarebbe solo nelle prestazioni e non nelle qualità. Ho capito bene :) ?

esatto; inoltre si tratta di una differenza realmente teorica, tanto che la stessa NV ha raccomandato agli sviluppatori di non farne uso; il dynamic branching è, in realtà, un'arma a doppio taglio, poichè facendo un'alisi dinamica di tipo predittivo, se ben implementata può ridurre la lunghezza degli shader in input e, quindi, la quantità di calcoli che la gpu deve eseguire; in caso contrario diventa un'autentica palla al piede, perchè costringe il chip a svolgere un lavoro molto oneroso

Circa le prestazioni dell'R420, sappiamo che con i ps2.0 è molto veloce (ma molto veloce è anche l'NV40); sarà da vedere se la path usata per testare R360 e R420 è composta solo da calcoli matematici, oppure se comprende anche texture. Se si può ipotizzare un input di tipo tex/fp/fp e, con tale input, l'R420 è il doppio più veloce dell'R360, allora vorrà dire che le 2 alu dell'R420, così come quelle dell'R360, sono indipendenti dalla tmu; il che significa che con un input come quello sopra citato, l'R420 è capace di 48 operazioni per clock, ossia il 100% in più dell'R360 ed il 75% in più dell'NV40 a parità di frequenza (ovviamente sono dati riferiti al solo motore ps e alle texture unit che non sono necessariamente indicativi delle prestazioni effettive con i giochi)

andreamarra
30-04-2004, 02:55
Originariamente inviato da yossarian
esatto; inoltre si tratta di una differenza realmente teorica, tanto che la stessa NV ha raccomandato agli sviluppatori di non farne uso; il dynamic branching è, in realtà, un'arma a doppio taglio, poichè facendo un'alisi dinamica di tipo predittivo, se ben implementata può ridurre la lunghezza degli shader in input e, quindi, la quantità di calcoli che la gpu deve eseguire; in caso contrario diventa un'autentica palla al piede, perchè costringe il chip a svolgere un lavoro molto oneroso

Complimenti yossarian, sei molto preparato :)

Ma sei ingegnere elettronico? O altro? :)

in pratica l'nvidia ha implemetato questa tecnologia per mere questioni di marketing, per potersi fregiare del supporto al 100% dei ps3.0. o mi sbaglio?

andreamarra
30-04-2004, 02:56
Visto che i fanATIci :asd: si lamentavano della scimmietta del demo della 9800pro (anche se ame piaceva), nvidia ha pensato anche a voi...




http://www.hothardware.com/reviews/images/nv40_debut/demos/NV_Timbury_02.jpg





bellissimi gli effetti, il soggetto un pò di meno :D

andreamarra
30-04-2004, 02:57
Questo è il terzo demo, la nave :)



http://www.hothardware.com/reviews/images/nv40_debut/demos/NV_Clear_Sailing_02.jpg

andreamarra
30-04-2004, 03:04
Ecco alcuni bench tratti da diversi siti sula nuovo gioiello nvidia...


http://www.hardwareanalysis.com/content/article/1708/

http://www.hothardware.com/viewarti...435&catid=2

http://www.anandtech.com/video/showdoc.html?i=2023

http://www.bit-tech.net/review/313/2

http://techreport.com/reviews/2004q...ra/index.x?pg=1

http://www.guru3d.com/article/Videocards/128/


Godete... :eek:

yossarian
30-04-2004, 03:04
Originariamente inviato da andreamarra
Complimenti yossarian, sei molto preparato :)

Ma sei ingegnere elettronico? O altro? :)

in pratica l'nvidia ha implemetato questa tecnologia per mere questioni di marketing, per potersi fregiare del supporto al 100% dei ps3.0. o mi sbaglio?


grazie per i complimenti; sono ingegnere elettronico.

Si, allo stato attuale, il dynamic branching e quindi anche il supporto ai ps3.0 è puro marketing, così come era puro marketing il supporto alle DX9 della precedente generazione; almeno questo nei confronti degli acquirenti.
Ovviamente la cosa non va vista nella maniera più negativa, perchè per gli sviluppatori sia di HW che di SW c'è la possibilità di fare nuove sperimentazioni per implementare nuove feature sui successivi chip.

Raven
30-04-2004, 08:31
/OT

le bandiere del galeone sventolano dalla parte sbagliata (controvento!) :D

... un po' come le famose 500 Lire... ;)

Simon82
30-04-2004, 08:35
Originariamente inviato da Raven
/OT

le bandiere del galeone sventolano dalla parte sbagliata (controvento!) :D

... un po' come le famose 500 Lire... ;)
Magari avevano sotto un motore TurboDiesel e riuscivano ad andare lo stesso.. :O


Oppure.. :eek:



Nvidia a cheattato anche qua.. :eek:..ha ottimizzato al punto che riescono ad andare controvento.. :eek::sofico::sofico::D

Perfectdavid
30-04-2004, 09:41
me lo spieghi?



Originariamente inviato da Raven
/OT

le bandiere del galeone sventolano dalla parte sbagliata (controvento!) :D

... un po' come le famose 500 Lire... ;)

Raven
30-04-2004, 09:54
Originariamente inviato da Perfectdavid
me lo spieghi?

:mbe:

... da come appaiono le vele (belle gonfie) è chiaro che il vento spira da poppa verso prua (dal fondo della nave verso la punta)... ma le bandierine in cima agli alberi sventolano nell'altro senso!!! ;)

Lo stesso errore fu commesso nella stampa delle 500Lire commemortaive della marina militare (l'errore fu poi corretto) :p

LittleLux
30-04-2004, 10:04
Originariamente inviato da Raven
:mbe:

... da come appaiono le vele (belle gonfie) è chiaro che il vento spira da poppa verso prua (dal fondo della nave verso la punta)... ma le bandierine in cima agli alberi sventolano nell'altro senso!!! ;)

Lo stesso errore fu commesso nella stampa delle 500Lire commemortaive della marina militare (l'errore fu poi corretto) :p

Bisogna tenerselo ben stretto sto demo...in futuro chissà, potrebbe valere qualche migliaio di euri:D

nonikname
30-04-2004, 10:37
Ma non lo sapete ??? , le bandiere sui galeoni dei pirati sono lavate senza coccolino (forse perchè è difficile trovarlo nel grande blu..) quindi rimangono irrigidite tipo carta pesta..

Dalla regia mi suggeriscono che potrebbero anche essere stabilizzatori aerodinamici per evitare il rollio della nave : sarà anche un galeone dei pirati , ma è sempre stato costruito al computer , quindi simulando la galleria del vento....siamo o non siamo nell'era della formula 1 e della motogp (che trasmette passione a 640kb/s :D )

zerothehero
30-04-2004, 11:12
Originariamente inviato da yossarian

Circa le prestazioni dell'R420, sappiamo che con i ps2.0 è molto veloce (ma molto veloce è anche l'NV40); sarà da vedere se la path usata per testare R360 e R420 è composta solo da calcoli matematici, oppure se comprende anche texture. Se si può ipotizzare un input di tipo tex/fp/fp e, con tale input, l'R420 è il doppio più veloce dell'R360, allora vorrà dire che le 2 alu dell'R420, così come quelle dell'R360, sono indipendenti dalla tmu; il che significa che con un input come quello sopra citato, l'R420 è capace di 48 operazioni per clock, ossia il 100% in più dell'R360 ed il 75% in più dell'NV40 a parità di frequenza (ovviamente sono dati riferiti al solo motore ps e alle texture unit che non sono necessariamente indicativi delle prestazioni effettive con i giochi)

Sarebbero queste le "extreme pipeline" di cui parlava ati?

ll fatto che le alu siano dipendenti dalla tmu in una situazione reale (come un gioco non un bench) comporterà grossi svantaggi?

Gatz1980
30-04-2004, 11:59
Originariamente inviato da yossarian
gli shot di cui parli, in realtà, non mostravano affatto la differenza qualitativa tra ps2.0 e ps3.0 del tutto inesistente, ma la differenza, secondo varie fonti, tra i ps1.1 e i ps3.0 (e, aggiungo io, con molta probabilità negli shot presi con ps1.1 anche con un livello di dettagli inferiore).

Su un link postato pochi giorni fa da halduemilauno (direi) ci sono screenshots presi con una GeForce4 Ti, una 5950U e una 9800 Pro, e non si nota una gran differenza (almno IO non la noto :p).
Questo mi fa pensare che quegli screen non fossero nemmeno fatti con gli shader 1.1, oppure comunque al livello di dettaglio minimo consentito, altrimenti la cosa non si spiega.

Il link è questo:
http://www.firingsquad.com/hardware/far_cry_nvidia/default.asp

nonikname
30-04-2004, 12:05
Leggete quì (http://www.prixdunet.com/liste/Carte_Graphique/?t=1&f_0=&f_429=NVIDIA+GeForce+6800+Ultra&f_662=&f_434=&f_435=) e qui (http://www.prixdunet.com/liste/Carte_Graphique/?t=1&f_0=&f_429=NVIDIA+GeForce+6800&f_662=&f_434=&f_435=)

halduemilauno
30-04-2004, 12:21
Originariamente inviato da Gatz1980
Su un link postato pochi giorni fa da halduemilauno (direi) ci sono screenshots presi con una GeForce4 Ti, una 5950U e una 9800 Pro, e non si nota una gran differenza (almno IO non la noto :p).
Questo mi fa pensare che quegli screen non fossero nemmeno fatti con gli shader 1.1, oppure comunque al livello di dettaglio minimo consentito, altrimenti la cosa non si spiega.

Il link è questo:
http://www.firingsquad.com/hardware/far_cry_nvidia/default.asp


tratto da 3DItalia.
"In seguito alla messa on line da parte di NVIDIA di una cattura schermo del noto videogame FarCry, allo scopo di evidenziare la bontà degli Shaders 3.0 e della sua GeForce 6800 il sito PC Perspective ha intervistato un responsabile della CryTek. Di seguito, alcune delle domande e risposte ottenute:

- Crytek prevede di integrare gli Shaders 3.0 nei suoi prossimi titoli?

Generalmente si, in tutti i futuri titoli.

- Nella cattura schermo rilasciata da NVIDIA perchè voi avete comparato i Pixel Shaders 1.1 con i Pixel Shaders 3.0 piuttosto che i Pixel Shaders 2.0 con i Pixel Shaders 3.0?

Noi abbiamo effettivamente fatto una comparativa tra gli Shaders 1.1 e fli Shaders 2.0/3.0. Generalmente noi utilizziamo la versione più bassa dei Pixels Shaders disponibile. I PS 3.0 non sono utilizzati in tutti i giochi.

- Quali aspetti dell'immagine mettono in risalto le features dei Pixel Shaders 3.0?

Allo stato attuale del motore, non ci sono differenze visive tra i Pixel Shaders 2.0 ed i 3.0. Il supporto dei Pixels Shaders 3.0 permette al momento, solo di ottenere migliori performances nella resa.

- Al livello della qualità, utilizzare gli Shaders 3.0 o gli Shaders 2.0 è identico?

Nel nostro attuale motore, la qualità di resa del PS 2.0 e PS 3.0 è identica. I PS 3.0 sono utilizzati per ottenere migliori performances.

Bisognerà attendere quindi qualche mese prima che i PS 3.0 mettano in luce quanto promettono in un nuovo motore. Per quanto riguardano le performances, bisognerà attendere l'arrivo di FarCry 1.2 e delle DirectX 9.0c per potersi esprimere".

non so se l'ho postato io o nonikname(che saluto)e aggiungo.
http://www.hardocp.com/article.html?art=NjA5
http://www.3dchips-fr.com/News/actualites/200404303.html
ciao.
:) :)

andreamarra
30-04-2004, 12:34
Faccio una domanda a yossarian (difficile, ma lui è preparataissimo... :) )

A tuo modo di vedere (conoscendo perfettamente sia l'architettura nv40 che quella r420 (stando ovviamente alle specifiche che ci sono in giro) te la senti di fare un pronostico sui due mostriciattoli nvidia e ati? Ci sarà un testa a testa insomma, o una delle due potrebbe avere il sopravvento?

Ovviamente non praticamente ma in linea teorica (dove vedo che sei ferratissimo ;) )

halduemilauno
30-04-2004, 12:38
Originariamente inviato da andreamarra
Faccio una domanda a yossarian (difficile, ma lui è preparataissimo... :) )

A tuo modo di vedere (conoscendo perfettamente sia l'architettura nv40 che quella r420 (stando ovviamente alle specifiche che ci sono in giro) te la senti di fare un pronostico sui due mostriciattoli nvidia e ati? Ci sarà un testa a testa insomma, o una delle due potrebbe avere il sopravvento?

Ovviamente non praticamente ma in linea teorica (dove vedo che sei ferratissimo ;) )


mi pare che lo ha gia fatto. ma aspetta lui per la conferma.
ciao.
;)

Jedi_Master
30-04-2004, 12:40
Originariamente inviato da nonikname
Leggete quì (http://www.prixdunet.com/liste/Carte_Graphique/?t=1&f_0=&f_429=NVIDIA+GeForce+6800+Ultra&f_662=&f_434=&f_435=) e qui (http://www.prixdunet.com/liste/Carte_Graphique/?t=1&f_0=&f_429=NVIDIA+GeForce+6800&f_662=&f_434=&f_435=)

Sono prezzi da fuori di testa!

x andreamarra
Mi sembra che te lo abbia gia' detto.
Se torni indietro di qualche pagina del 3d,
forse li' e' stato piu' chiaro.

Legolas84
30-04-2004, 12:51
La lisca 350 euro.... mi pare allineato....

Jedi_Master
30-04-2004, 12:58
Originariamente inviato da Legolas84
La lisca 350 euro.... mi pare allineato....

Secondo me no!
Sono piu' di 100 euro di una 9800pro, e secondo
quanto detto prima (a meno che non vada quasi come la ultra)
non li vale......poi la ultra a 550 quasi 600....
:tapiro:

R@nda
30-04-2004, 13:04
Sono i soliti prezzi di lancio...

JENA PLISSKEN
30-04-2004, 13:05
Originariamente inviato da R@nda
Sono i soliti prezzi di lancio...

Già...sempre quelli da secoli...lameno con l' € Nn sono aumentati:eek: :eek:

Perfectdavid
30-04-2004, 13:05
ma a me non sembra ci sia tutto questo vento (il mare è calmo)
le vele sono un pò gonfie perchè prendono anche un pò di vento e lle bandiere sono contro il verso di percorrenza... :D



Originariamente inviato da LittleLux
Bisogna tenerselo ben stretto sto demo...in futuro chissà, potrebbe valere qualche migliaio di euri:D

halduemilauno
30-04-2004, 13:11
Originariamente inviato da Jedi_Master
Secondo me no!
Sono piu' di 100 euro di una 9800pro, e secondo
quanto detto prima (a meno che non vada quasi come la ultra)
non li vale......poi la ultra a 550 quasi 600....
:tapiro:


:rotfl: :rotfl: :rotfl: :rotfl:

nonikname
30-04-2004, 13:12
http://www.computerbase.de/picture/news/7597/1.jpg

nonikname
30-04-2004, 13:15
DIMENTICAVO : IL prezzo di lancio della
X800 pro è di 499€ mentre quello della
X800XT è di 599€.....

Fate voi :sofico:

Perfectdavid
30-04-2004, 13:17
le 6800gt quindi sono le ultra sfortunate...

Perfectdavid
30-04-2004, 13:20
uhm...viva nvidia....



Originariamente inviato da nonikname
DIMENTICAVO : IL prezzo di lancio della
X800 pro è di 499€ mentre quello della
X800XT è di 599€.....

Fate voi :sofico:

halduemilauno
30-04-2004, 13:24
Originariamente inviato da nonikname
DIMENTICAVO : IL prezzo di lancio della
X800 pro è di 499€ mentre quello della
X800XT è di 599€.....

Fate voi :sofico:


quindi la gt ha un solo molex ma soprattutto ha 16 pipe.
bene molto bene. aspettiamo conferme.
ciao Nonikname.
:) :)

Veghan
30-04-2004, 13:29
Quinde 6800gt, avrà solo frequenze inferiori e nn sarà "castrata" come la versione liscia, molto interessante......

Paoletta Corsini
30-04-2004, 13:31
Originariamente inviato da nonikname
DIMENTICAVO : IL prezzo di lancio della
X800 pro è di 499€ mentre quello della
X800XT è di 599€.....

Fate voi :sofico:
Fonte?

Legolas84
30-04-2004, 13:44
Originariamente inviato da halduemilauno
quindi la gt ha un solo molex ma soprattutto ha 16 pipe.
bene molto bene. aspettiamo conferme.
ciao Nonikname.
:) :)


La GT sembra un grande offerta.....

Molto interessante... :)

halduemilauno
30-04-2004, 13:56
Originariamente inviato da Legolas84
La GT sembra un grande offerta.....

Molto interessante... :)


credo che l'immagine postata sia una "riveduta" della nuova gamma. che si crede abbia quelle caratteristiche.
come detto tutto da confermare. IHMO.
ciao.
:) :)

nonikname
30-04-2004, 14:05
Originariamente inviato da Paoletta Corsini
Fonte?



Meristation (http://www.meristation.com/sc/noticias/noticia.asp?c=GEN&n=13369)

Traduzione del pezzo incriminato:"Knowing the market it is not very difficult to put a price to him to this dream, and from Meristation we considered that the X800PRO will be commercialized between the 449 and 499€, whereas the version XT does it between the 549 and 599€ depending on "retailer" that it commercializes them."

Ciao Hal2k1 :)

yossarian
30-04-2004, 14:41
Originariamente inviato da zerothehero
Sarebbero queste le "extreme pipeline" di cui parlava ati?

ll fatto che le alu siano dipendenti dalla tmu in una situazione reale (come un gioco non un bench) comporterà grossi svantaggi?


nelle elaborazioni miste ps2.0/ps3.0+texture, soprattutto nei casi in cui si è shader limited, l'R420, se veramente avesse unità di calcolo indipendenti, svolgerebbe 16i operazioni in più rispetto all'NV40 per ciclo di clock

JENA PLISSKEN
30-04-2004, 14:48
Originariamente inviato da yossarian
nelle elaborazioni miste ps2.0/ps3.0+texture, soprattutto nei casi in cui si è shader limited, l'R420, se veramente avesse unità di calcolo indipendenti, svolgerebbe 16i operazioni in più rispetto all'NV40 per ciclo di clock

Addirittura?':confused:

Haku
30-04-2004, 14:54
la 6800 liscia si distaccherà molto da un fx 5900 o da una radeon 9800pro?Calcolando che la 6800 ultra è più o meno il doppio delle due elencate

Thunder82
30-04-2004, 14:59
Originariamente inviato da Haku
la 6800 liscia si distaccherà molto da un fx 5900 o da una radeon 9800pro?Calcolando che la 6800 ultra è più o meno il doppio delle due elencate

Io penso che la 6800 liscia, a 325MHz di core e 12 pipeline (se le slide postate la pag. precedente sono veritiere) se la giochi in prestazioni con la 9800XT a 412MHz e 8 pipeline

halduemilauno
30-04-2004, 15:00
Originariamente inviato da Haku
la 6800 liscia si distaccherà molto da un fx 5900 o da una radeon 9800pro?Calcolando che la 6800 ultra è più o meno il doppio delle due elencate


penso proprio di si.

;)

dario fgx
30-04-2004, 15:04
anche io!

Jedi_Master
30-04-2004, 15:10
Originariamente inviato da Thunder82
Io penso che la 6800 liscia, a 325MHz di core e 12 pipeline (se le slide postate la pag. precedente sono veritiere) se la giochi in prestazioni con la 9800XT a 412MHz e 8 pipeline

Piu' o meno dovrebbe essere cosi'.
Ma forse ci perde pure in applicazioni dove gli shader
la fanno da padrone (vedi Far Cry ecc..).

yossarian
30-04-2004, 18:19
Originariamente inviato da andreamarra
Faccio una domanda a yossarian (difficile, ma lui è preparataissimo... :) )

A tuo modo di vedere (conoscendo perfettamente sia l'architettura nv40 che quella r420 (stando ovviamente alle specifiche che ci sono in giro) te la senti di fare un pronostico sui due mostriciattoli nvidia e ati? Ci sarà un testa a testa insomma, o una delle due potrebbe avere il sopravvento?

Ovviamente non praticamente ma in linea teorica (dove vedo che sei ferratissimo ;) )


in realtà la domanda che mi hai fatto non è difficile, ma, al momento impossibile.
Conosco alcuni dettagli dell'architettura dell'R420 e tutto quello che può interessarmi per fare valutazioni su quella dell'NV40. Il problema è che dell'R420 non so alcune cose fondamentali. Forse le spiegazioni saranno un po' lunghe, quindi mettiti comodo.
So che in un test ps2.0 pp only, l'R420 si è dimostrato veloce il doppio rispetto all'R360. Però la path utilizzata, pur essendo di tipo misto, impiega poche texture fetch rispetto alle istruzioni matematiche. Questo non mi permette di avere indicazioni circa l'eventuale indipendenza di alu e tmu nell'R420. Diverso sarebbe stato il discorso con una path che proponeva un input con un numero di istruzioni dei due tipi tali da poter avere calcoli di tipo tex/fp/fp. Se fpu e tmu dell'R420 dovessero dimostrarsi indipendenti, questo costiuirebbe un vantaggio non indifferente per ATi, in quanto il chip sarebbe capace di un massimo di 48*525.000.000 = 25.200*10^6 operazioni al secondo contro le 32*400*10^6 = 12.800*10^6 dell'NV40 (considerando solo operazioni matematiche e sulle texture).
In caso contrario, il vantaggio si riduce a 16.800*10^6 del chip ATi contro le 12.800*10^6 di quello NV (come vedi, la differenza è sostanziale).
Altro dato di cui non sono a conoscenza è la conformazione di ogni singola fpu dell'R420. R3x0 le aveva in configurazione 3+1; NV40 le ha in configurazione superscalare (1+1+1+1); R420?
Una 3+1 è più veloce quando elabora i dati di un vettore completo (4 componenti) oppure nell'elaborare dati relativi a due diverse istruzioni (3 per una e 1 per l'altra), però quando l'input è in forma 2+2 ha bisogno di 2 cicli di clock; la superscalare è meno veloce ma è più flessibile e permette di elaborare anche i dati 2+2 in un unico ciclo. Questo perchè la singola unità composta da 3 scalari fp24 dell'R3x0 è vista, dai dati ingresso, come un'unica unità capace di elaborare dati con 1, 2 o 3 variabili o parametri, mentre ciascuna delle 4 unità dell'architettura superscalare è vista come una singola unità fp scalare dai dati ingresso (quindi, in teoria, si potrebbero elaborare dati relativi a 4 diverse istruzioni, ognuna caratterizzata da una singola variabile, in un unico ciclo, se questo fosse necessario). Se R420 ha un'architettura superscalare, allora, da questo punto di vista, partirà alla pari con NV e avrà il solo vantaggio delle maggiori frequenze; in caso contrario, sarà un po' più veloce in alcune elaborazioni ma sarà penalizzato in altre.
Altro dato mancante è la bontà degli algoritmi di compressione dati e di gestione della ram adoperati. Finora si è discusso come se si avesse a disposizione un bus illimitato. In realtà non è così; già con la precedente generazione si era visto che, in alcune situazioni, si iniziavano ad evidenziare problemi di limitazione in banda. Con l'attuale questi problemi saranno accentuati, perchè, raddoppiando le pipeline, si dimezza il canale di comunicazione con la ram riservato a ciascuna pipeline. E' vero che una architettura crossbar permette di minimizzare questo tipo di problema, però non sarà possibile aggirarlo. Se non si ricorresse a ram GDDR3 sarebbe impossibile far lavorare questi chip ad alte risoluzioni e con filtri attivi, senza "strangolarli"; e anche con le GDDR3 il problema è solo spostato un po' più in là, poichè l'aumento di bandwidth non va di pari passo con l'aumento della capacità di calcolo. Si può affermare che se si fosse rimasti alle ram DDR, con 16 pipeline si sarebbe dovuti ricorrere necessariamente al bus a 512 bit, per permettere a ciascuna pipeline di avere a disposizione un canale capace dello stesso quantitativo di dati trasferito nella precedente generazione di chip (uno dei conti della serva che si possono fare e che, all'atto pratico si fanno è il seguente: 4 pipeline e 128 bit con ram DDR equivalente ad un bus di 256 bit, danno 256/4=64; con 8 pipe e bus a 256 DDR si ha 512/8=64; con 16 pipe sarebbe necessario avere 1024/16=64, ossia bus a 512 bit DDR per mantenere lo stesso rapporto. Ovviamente l'aumento di frequenza delle ram e il miglioramento degli algoritmi di compressione e di gestione del memory bus permettono di avere qualche margine di tolleranza). Il motivo principale per cui non si è adottato un controller a 512 bit è che ciò avrebbe richiesto le revisione dell'intera architettura interna dei chip che sarebbero dovuti diventare a 1024 bit, contro i 512 attuali, per non creare colli di bottiglia a valle del memory bus controller.
Altro elemento di cui non sono a conoscenza è il numero di unità VS dell'R420; da alcuni test sembrano essere 6 (come per l'NV40), però serve una conferma.
Altro dato mancante è quello relativo alle funzionalità con calcoli in virgola fissa. Dai dati teorici, posso desumere che l'NV40 si comporti come una 12+4, ossia che, con funzioni fx (shader DX8.x) solo 12 delle 16 pipeline siano in grado di svolgere operazioni. Dell'R420 noon so niente al riguardo: potrebbe essere una full 16 o una 12+4 (come potrebbero far pensare anche i probaili 6 VS).
Infine c'è la parte relativa alle fragment operations; l'NV40 ha due linee di calcolo in parallelo che, in caso di operazioni che coinvolgano solo lo z-buffer (quindi senza colour ops né texture ops) può sfornare 32 pixel per ciclo (sarebbe meglio definirli zixel, forse); R420, molto probabilmente, non implementerà questa funzionalità (che era presente su NV3x e non su R3x0). Questa feature, attualmente non mi risulta che sia utilizzata o, se lo è, lo è in misura minima; però pare che sia usata nel motore grafico di Doom3 (e ovviamente di tutti i giochi che faranno uso dello stesso motore).
C'è infine il discorso "filtri"; e qui il TAA può far segnare un punto a favore di ATi.

Questo solo per elencare i principali punti oscuri che non permettono di dare giudizi definitivi.
Parlando per sensazioni, diciamo che l'impressione che ho è che l'R420 sarà, in generale, più veloce (di quanto non è possibile saperlo al momento); l'NV40 presenta qualche opzione in più che però, allo stato attuale, è più utile ai programmatori che non a fini realmente pratici. In futuro si vedrà (parlo soprattutto della branch unit)

riassumendo

indipendenza fpu/tmu forse a vantaggio di ATi (se ne dovrà verificare l'archietttura)

frequenza a vantaggio di ATi (comunque la si giri, il low-k permette frequenze maggiori perchè diminuisce le interferenze tra circuiti diminuendo l'accoppiamento capacitivo.

Architettura superscalare: potrebbe essere un punto a vantaggio di NV (se l'R420 non dovesse adottarla, cosa da verificare)

Algoritmi di compressione: quelli di NV sembrano abbastanza tradizionale; ATi dichiara di averne trovato uno che permette compressioni senza perdite fino a 8:1 (che però non funziona per le ombre); è tutto da verificare

Unità VS (pare che siano 6 per entrambe; per l'NV40 lo sappiamo per certo, per l'R420 no). Da verificare

Calcoli in virgola fissa: non sappiamo come funziona l'R420; potrebbe avere, in questo caso, qualche vantaggio (soprattutto se fosse una full 16 pipeline); da verificare

Fragment operations; NV dovrebbe avere qualche vantaggio nei giochi che fanno ampio uso di zixel

Filtri: il TAA fa segnare un punto a favore di ATi

Branch unit; al momento è più una moda; in futuro, forse, potrebbe dare qualche vantaggio ad NV; tutto da verificare.

Sawato Onizuka
30-04-2004, 21:05
http://www.pugheaven.co.uk/pug1000fx.htm

:rotfl: :rotfl: :rotfl:

o era :old: ? :muro:

DjLode
30-04-2004, 21:31
Originariamente inviato da yossarian
Unità VS (pare che siano 6 per entrambe; per l'NV40 lo sappiamo per certo, per l'R420 no). Da verificare


Prendilo come rumor, da quanto ho letto l'R420 pare averne 8, 2 per quad. Il che spiegherebbe il perchè l'X800SE ne ha 4 e la Pro 6. Ma non ci è dato sapere altro.

andreamarra
30-04-2004, 21:49
Originariamente inviato da yossarian
in realtà la domanda che mi hai fatto non è difficile, ma, al momento impossibile.
Conosco alcuni dettagli dell'architettura dell'R420 e tutto quello che può interessarmi per fare valutazioni su quella dell'NV40. Il problema è che dell'R420 non so alcune cose fondamentali. Forse le spiegazioni saranno un po' lunghe, quindi mettiti comodo.
So che in un test ps2.0 pp only, l'R420 si è dimostrato veloce il doppio rispetto all'R360. Però la path utilizzata, pur essendo di tipo misto, impiega poche texture fetch rispetto alle istruzioni matematiche. Questo non mi permette di avere indicazioni circa l'eventuale indipendenza di alu e tmu nell'R420. Diverso sarebbe stato il discorso con una path che proponeva un input con un numero di istruzioni dei due tipi tali da poter avere calcoli di tipo tex/fp/fp. Se fpu e tmu dell'R420 dovessero dimostrarsi indipendenti, questo costiuirebbe un vantaggio non indifferente per ATi, in quanto il chip sarebbe capace di un massimo di 48*525.000.000 = 25.200*10^6 operazioni al secondo contro le 32*400*10^6 = 12.800*10^6 dell'NV40 (considerando solo operazioni matematiche e sulle texture).
In caso contrario, il vantaggio si riduce a 16.800*10^6 del chip ATi contro le 12.800*10^6 di quello NV (come vedi, la differenza è sostanziale).
Altro dato di cui non sono a conoscenza è la conformazione di ogni singola fpu dell'R420. R3x0 le aveva in configurazione 3+1; NV40 le ha in configurazione superscalare (1+1+1+1); R420?
Una 3+1 è più veloce quando elabora i dati di un vettore completo (4 componenti) oppure nell'elaborare dati relativi a due diverse istruzioni (3 per una e 1 per l'altra), però quando l'input è in forma 2+2 ha bisogno di 2 cicli di clock; la superscalare è meno veloce ma è più flessibile e permette di elaborare anche i dati 2+2 in un unico ciclo. Questo perchè la singola unità composta da 3 scalari fp24 dell'R3x0 è vista, dai dati ingresso, come un'unica unità capace di elaborare dati con 1, 2 o 3 variabili o parametri, mentre ciascuna delle 4 unità dell'architettura superscalare è vista come una singola unità fp scalare dai dati ingresso (quindi, in teoria, si potrebbero elaborare dati relativi a 4 diverse istruzioni, ognuna caratterizzata da una singola variabile, in un unico ciclo, se questo fosse necessario). Se R420 ha un'architettura superscalare, allora, da questo punto di vista, partirà alla pari con NV e avrà il solo vantaggio delle maggiori frequenze; in caso contrario, sarà un po' più veloce in alcune elaborazioni ma sarà penalizzato in altre.
Altro dato mancante è la bontà degli algoritmi di compressione dati e di gestione della ram adoperati. Finora si è discusso come se si avesse a disposizione un bus illimitato. In realtà non è così; già con la precedente generazione si era visto che, in alcune situazioni, si iniziavano ad evidenziare problemi di limitazione in banda. Con l'attuale questi problemi saranno accentuati, perchè, raddoppiando le pipeline, si dimezza il canale di comunicazione con la ram riservato a ciascuna pipeline. E' vero che una architettura crossbar permette di minimizzare questo tipo di problema, però non sarà possibile aggirarlo. Se non si ricorresse a ram GDDR3 sarebbe impossibile far lavorare questi chip ad alte risoluzioni e con filtri attivi, senza "strangolarli"; e anche con le GDDR3 il problema è solo spostato un po' più in là, poichè l'aumento di bandwidth non va di pari passo con l'aumento della capacità di calcolo. Si può affermare che se si fosse rimasti alle ram DDR, con 16 pipeline si sarebbe dovuti ricorrere necessariamente al bus a 512 bit, per permettere a ciascuna pipeline di avere a disposizione un canale capace dello stesso quantitativo di dati trasferito nella precedente generazione di chip (uno dei conti della serva che si possono fare e che, all'atto pratico si fanno è il seguente: 4 pipeline e 128 bit con ram DDR equivalente ad un bus di 256 bit, danno 256/4=64; con 8 pipe e bus a 256 DDR si ha 512/8=64; con 16 pipe sarebbe necessario avere 1024/16=64, ossia bus a 512 bit DDR per mantenere lo stesso rapporto. Ovviamente l'aumento di frequenza delle ram e il miglioramento degli algoritmi di compressione e di gestione del memory bus permettono di avere qualche margine di tolleranza). Il motivo principale per cui non si è adottato un controller a 512 bit è che ciò avrebbe richiesto le revisione dell'intera architettura interna dei chip che sarebbero dovuti diventare a 1024 bit, contro i 512 attuali, per non creare colli di bottiglia a valle del memory bus controller.
Altro elemento di cui non sono a conoscenza è il numero di unità VS dell'R420; da alcuni test sembrano essere 6 (come per l'NV40), però serve una conferma.
Altro dato mancante è quello relativo alle funzionalità con calcoli in virgola fissa. Dai dati teorici, posso desumere che l'NV40 si comporti come una 12+4, ossia che, con funzioni fx (shader DX8.x) solo 12 delle 16 pipeline siano in grado di svolgere operazioni. Dell'R420 noon so niente al riguardo: potrebbe essere una full 16 o una 12+4 (come potrebbero far pensare anche i probaili 6 VS).
Infine c'è la parte relativa alle fragment operations; l'NV40 ha due linee di calcolo in parallelo che, in caso di operazioni che coinvolgano solo lo z-buffer (quindi senza colour ops né texture ops) può sfornare 32 pixel per ciclo (sarebbe meglio definirli zixel, forse); R420, molto probabilmente, non implementerà questa funzionalità (che era presente su NV3x e non su R3x0). Questa feature, attualmente non mi risulta che sia utilizzata o, se lo è, lo è in misura minima; però pare che sia usata nel motore grafico di Doom3 (e ovviamente di tutti i giochi che faranno uso dello stesso motore).
C'è infine il discorso "filtri"; e qui il TAA può far segnare un punto a favore di ATi.

Questo solo per elencare i principali punti oscuri che non permettono di dare giudizi definitivi.
Parlando per sensazioni, diciamo che l'impressione che ho è che l'R420 sarà, in generale, più veloce (di quanto non è possibile saperlo al momento); l'NV40 presenta qualche opzione in più che però, allo stato attuale, è più utile ai programmatori che non a fini realmente pratici. In futuro si vedrà (parlo soprattutto della branch unit)

riassumendo

indipendenza fpu/tmu forse a vantaggio di ATi (se ne dovrà verificare l'archietttura)

frequenza a vantaggio di ATi (comunque la si giri, il low-k permette frequenze maggiori perchè diminuisce le interferenze tra circuiti diminuendo l'accoppiamento capacitivo.

Architettura superscalare: potrebbe essere un punto a vantaggio di NV (se l'R420 non dovesse adottarla, cosa da verificare)

Algoritmi di compressione: quelli di NV sembrano abbastanza tradizionale; ATi dichiara di averne trovato uno che permette compressioni senza perdite fino a 8:1 (che però non funziona per le ombre); è tutto da verificare

Unità VS (pare che siano 6 per entrambe; per l'NV40 lo sappiamo per certo, per l'R420 no). Da verificare

Calcoli in virgola fissa: non sappiamo come funziona l'R420; potrebbe avere, in questo caso, qualche vantaggio (soprattutto se fosse una full 16 pipeline); da verificare

Fragment operations; NV dovrebbe avere qualche vantaggio nei giochi che fanno ampio uso di zixel

Filtri: il TAA fa segnare un punto a favore di ATi

Branch unit; al momento è più una moda; in futuro, forse, potrebbe dare qualche vantaggio ad NV; tutto da verificare.


Ti ringrazio per la disponibilità e per i commenti tecnici ineccepibili (oddio, potresti anche scrivere di proposito una nefandezza da farti radiare dall'albo degli ingegneri, che io non me ne accorgerei :D )

:)

Praticamente della nv40 si sa molto e della R420 pochissimo... non credevo ci fossero tutti questi misteri sulla nuova ATI.

Volevo sapere cosa ne pensi tu dell'AA-T: a tuo giudizio era già pronto da tempo (in modo da farlo uscire in concomitanza con il nuovo R420)?

Ma soprattutto volevo sapere (e secondo me non solo io) se oltre ad avere dei grossi vantaggi ha anche dei rovesci della medaglia. In un altro 3d discutevo proprio di questo con un altro utente...


Ovviamente dimenticavo una cosa fondamentale: a livello pratico mi sembra di avere capito con dei test che ho fatto che attivare un AA6X e un AAT2X3 sia qualitativamente la stessa cosa. Esatto? Ma soprattutto: nel caso che ho espresso, l'AAt2*3 caricherebbe la scheda video dell'onere del più leggero 2X, esatto? E poi una considerazione: alivello pratico l'nvidia potrà applicare un tipo di filtro come l'AAT?

Grazie :)

yossarian
30-04-2004, 22:27
Originariamente inviato da DjLode
Prendilo come rumor, da quanto ho letto l'R420 pare averne 8, 2 per quad. Il che spiegherebbe il perchè l'X800SE ne ha 4 e la Pro 6. Ma non ci è dato sapere altro.


non mi ero basato su quei rumors, ma su alcuni test eseguiti, che però non mettono ancora la parola fine sulla questione 6/8 VS (non si tratta di test specifici, ma che forniscono solo indicazioni di massima)

;)

DjLode
30-04-2004, 22:29
Originariamente inviato da yossarian
non mi ero basato su quei rumors, ma su alcuni test eseguiti, che però non mettono ancora la parola fine sulla questione 6/8 VS (non si tratta di test specifici, ma che forniscono solo indicazioni di massima)

;)

Ah, pensavo ti fossi basato solo su quello che si diceva in giro :)

R@nda
30-04-2004, 22:31
Bhe adesso sono ancora più curioso di sapere.....

yossarian
30-04-2004, 22:56
Originariamente inviato da andreamarra
Ti ringrazio per la disponibilità e per i commenti tecnici ineccepibili (oddio, potresti anche scrivere di proposito una nefandezza da farti radiare dall'albo degli ingegneri, che io non me ne accorgerei :D )

:)

Praticamente della nv40 si sa molto e della R420 pochissimo... non credevo ci fossero tutti questi misteri sulla nuova ATI.

Volevo sapere cosa ne pensi tu dell'AA-T: a tuo giudizio era già pronto da tempo (in modo da farlo uscire in concomitanza con il nuovo R420)?

Ma soprattutto volevo sapere (e secondo me non solo io) se oltre ad avere dei grossi vantaggi ha anche dei rovesci della medaglia. In un altro 3d discutevo proprio di questo con un altro utente...


Ovviamente dimenticavo una cosa fondamentale: a livello pratico mi sembra di avere capito con dei test che ho fatto che attivare un AA6X e un AAT2X3 sia qualitativamente la stessa cosa. Esatto? Ma soprattutto: nel caso che ho espresso, l'AAt2*3 caricherebbe la scheda video dell'onere del più leggero 2X, esatto? E poi una considerazione: alivello pratico l'nvidia potrà applicare un tipo di filtro come l'AAT?

Grazie :)

se continuo così, prima o poi sarò radiato comunque :D


il TAA si basa su una tecnologia analoga a quella già adoperata per il frame buffer, che permette di avere sati immagazzinati a 16 bit per canale (anzichè a 8) pur adoperando solo 8 bit scelti in maniera random tra i 16. Ossia si effettua il campionamento a 16 livelli e poi se ne selezionano 8 per volta. Questo simula un output con qualità prossima ai 16 bit, avendo un impatto prestazionale e, soprattutto, a livello di spazio occupato, molto vicino alla soluzione ad 8 bit; questa tecnica è nota da circa un anno e mezzo quindi non è ascluso che anche la sua applicazione in altri campi, come ad esempio l'AA fosse già in fase di studi avanzata (per l'AF la cosa è però un po' più complicata anche se non è escluso che si possa applicare anche li). Ti meraviglierebbe sapere sapere che persino io, pur non lavorando nel settore, ero a conoscenza di questo tipo di implementazione dell'AA già da diverso tempo? ;)
La controindicazione è dettata direttamente da quello che è il potere di risoluzione temporale del sistema occhi-cervello. Non siamo in grado di percepire come distinti due fotogrammi che si susseguano con un intervallo pari o superiore ad 1/16 , 1/18 di secondo (quindi chi vede scatti, non rallentamenti, ma scatti) quando gli fps sono sopra i 16 o 18 è ET o non ha ben chiaro il concetto di scatto (che non ha niente a che vedere con quello di fluidità che è un'esperienza molto soggettiva che dipende dagli abituali ritmi di gioco). Trattandosi, nel caso di x3 di 3 immagini sovrapposte (praticamente è quello che fa il TAA) e tenendo conto che ogni quadro è composto da 2 semiquadri (per i monitor CRT), perchè non si rischi di notare fastidiosi artefatti la frequenza di refresh non dovrebbe scendere sotto i 96 Hz (16*3*2) e , in modalità 2x sotto i 64 Hz (16*2*2) (meglio se ci si tiene attorno ai 100 Hz per la 3x e attorno ai 70 per la 2x).

A livello qualitativo, il 3x si avvicina ad un RGMS 6x avendo un impatto prestazionale effettivamente vicino a quello del 2x.

Se sia applicabile anche su NV40 non saprei dirtelo; bisogna vedere se a livello di logica di funzionamento del chip è prevista una rotazione della griglia. Ad esempio l'R300 prevede una pattern grid standard ma prevede anche l'utilizzo di pattern grid differenti (l'NV30 non mi risulta che faccia qualcosa del genere)

OT: seguo sempre i thread che aprite sul calcio e sulla Juve in particolare ;) FINE OT

ciao

yossarian
30-04-2004, 22:57
Originariamente inviato da DjLode
Ah, pensavo ti fossi basato solo su quello che si diceva in giro :)


quelle cose manco le leggo o al massimo gli do un'occhiata veloce (tanto sono tutte cose già note oppure boiate pazzesche) ;)

MaBru
30-04-2004, 23:55
Originariamente inviato da yossarian
OT: seguo sempre i thread che aprite sul calcio e sulla Juve in particolare ;) FINE OT

Aaaaarrrrgggghhhhh... uno juventino!:muro: ;) :D

yossarian
01-05-2004, 00:00
Originariamente inviato da MaBru
Aaaaarrrrgggghhhhh... uno juventino!:muro: ;) :D


no; sono della Roma. Però i thread che aprono gli juventini sono, secondo me, quelli più divertenti. andreamarra, tra l'altro, è uno dei miei idoli.

:D

MaBru
01-05-2004, 00:11
Originariamente inviato da yossarian
no; sono della Roma.

Molto meglio

andreamarra, tra l'altro, è uno dei miei idoli.

:wtf: :D

Vifani
01-05-2004, 00:12
Bella spiegazione yossarian. Anche se non rispondo spesso ho seguito e letto tutte le 124 pagine di questo topic :)

Dark Schneider
01-05-2004, 00:14
Rieccomi dopo giorni di assenza...ho avuto alcuni problemini. Ho letto un po'...cmq ragà sinceramente a me sembra na minchiata quei test con i vari path su FC. Cioè da quello che so io..NV40 esegue FC con la patch 1.1 in maniera NV3x. Poi si li hanno forzato e provato a vedere come si comportava in maniera R300.......ok che vabbè ci sono diverse cose in cui NV40 ha ripreso da R3xx....ma si tratta pur sempre di una Gpu cmq diversa. Ho letto in un sito che uscirà una patch 1.2 e che NV40 potrà funzionare alla sua "maniera". Quindi che dire? Attendiamo! :)

sanitarium
01-05-2004, 00:17
Originariamente inviato da Dark Schneider
Rieccomi dopo giorni di assenza...ho avuto alcuni problemini. Ho letto un po'...cmq ragà sinceramente a me sembra na minchiata quei test con i vari path su FC. Cioè da quello che so io..NV40 esegue FC con la patch 1.1 in maniera NV3x. Poi si li hanno forzato e provato a vedere come si comportava in maniera R300.......ok che vabbè ci sono diverse cose in cui NV40 ha ripreso da R3xx....ma si tratta pur sempre di una Gpu cmq diversa. Ho letto in un sito che uscirà una patch 1.2 e che NV40 potrà funzionare alla sua "maniera". Quindi che dire? Attendiamo! :)

Se non erro "maniera R300" significa semplicemente forzare NV40 a rispettare il path standard del gioco, non significa far girare il gioco secondo delle ottimizzazioni appositamente ideate per R300.

Dark Schneider
01-05-2004, 00:22
Originariamente inviato da yossarian

Se fpu e tmu dell'R420 dovessero dimostrarsi indipendenti, questo costiuirebbe un vantaggio non indifferente per ATi, in quanto il chip sarebbe capace di un massimo di 48*525.000.000 = 25.200*10^6 operazioni al secondo contro le 32*400*10^6 = 12.800*10^6 dell'NV40 (considerando solo operazioni matematiche e sulle texture).
In caso contrario, il vantaggio si riduce a 16.800*10^6 del chip ATi contro le 12.800*10^6 di quello NV (come vedi, la differenza è sostanziale).





Yoss scusa: ma quale logica porterebbe Ati a tornare alla "dipendenza"? Mi spiego meglio: non sto dicendo che sono idioti se vanno a rimettere la dipendenza tra fpu e tmu che nella loro precedente generazione era indipendente. Ma intendo proprio quale potrebbe essere un motivo che magari agli ingegneri Ati ha fatto pensare "meglio rimettere la dipendenza". Magari c'è qlc che potrebbe chessò avvantaggiare in qlc altro ambito e per questo chessò hanno dovuto rimettere la dipendenza?

Dark Schneider
01-05-2004, 00:26
Originariamente inviato da sanitarium
Se non erro "maniera R300" significa semplicemente forzare NV40 a rispettare il path standard del gioco, non significa far girare il gioco secondo delle ottimizzazioni appositamente ideate per R300.


Ma forse limita le caratteristiche di NV40 che magari potrebbero dare un boost maggiore se utilizzate. Penso che se uscirà questa 1.2 che farà girare NV40 alla sua maniera significhi anche qlc.

sanitarium
01-05-2004, 00:28
Originariamente inviato da Dark Schneider
Ma forse limita le caratteristiche di NV40 che magari potrebbero dare un boost maggiore se utilizzate. Penso che se uscirà questa 1.2 che farà girare NV40 alla sua maniera significhi anche qlc.

Aspettiamo questa patch 1.2. :)

Dark Schneider
01-05-2004, 00:28
Originariamente inviato da nonikname
http://www.computerbase.de/picture/news/7597/1.jpg


Ma praticamente questo GT dovrebbe essere la Pro, giusto? :)

Cavolo allora sarà proprio questa la GPU da prendere...se ne avrà 16!! :)
Naturalmente Ati permettendo...:D

Dark Schneider
01-05-2004, 00:29
Originariamente inviato da sanitarium
Aspettiamo questa patch 1.2. :)


Si infatti!! Alla fine è l'unica cosa che possiam fare!! :)
Cmq son contento: NV40 e R420 sono due GPU che mi piacciono. :)

yossarian
01-05-2004, 00:31
Originariamente inviato da Vifani
Bella spiegazione yossarian. Anche se non rispondo spesso ho seguito e letto tutte le 124 pagine di questo topic :)


grazie; ricordo ancora le discussioni con te, Whelk (chissà che fine ha fatto) e qualche altro utente quando si cercava di capire il funzionamento del TBR subito dopo l'uscita del Kyro2; bei tempi


;)

Dark Schneider
01-05-2004, 00:33
Originariamente inviato da nonikname
DIMENTICAVO : IL prezzo di lancio della
X800 pro è di 499€ mentre quello della
X800XT è di 599€.....

Fate voi :sofico:


Hai chiesto al tuo fornitore?:confused:
Mazza mi sembrano alti assai..sopratutto la Pro.
Ma la Pro non doveva essere 399?

Vabbè che credo che questi siano i prezzi con incluse tutte le tasse, giusto? Però la Pro me l'aspettavo sui 400...non 500!!:confused:

yossarian
01-05-2004, 00:35
Originariamente inviato da Dark Schneider
Yoss scusa: ma quale logica porterebbe Ati a tornare alla "dipendenza"? Mi spiego meglio: non sto dicendo che sono idioti se vanno a rimettere la dipendenza tra fpu e tmu che nella loro precedente generazione era indipendente. Ma intendo proprio quale potrebbe essere un motivo che magari agli ingegneri Ati ha fatto pensare "meglio rimettere la dipendenza". Magari c'è qlc che potrebbe chessò avvantaggiare in qlc altro ambito e per questo chessò hanno dovuto rimettere la dipendenza?


logica tecnica: utilizzo di un minor numero di transistor e circuiti più semplificati (si utilizzerebbero, ad esempio, registri temporanei comuni (che con i PS3.0 sono saliti da 12 a 32 per unità PS); non esistono vantaggi in altri ambiti: tieni conto che avere tante unità indipendenti equivale ad avere la possibilità di far svolgere al chip tante operazioni in contemporanea.

logica di marketing: fanno uscire adesso un'architettura più lenta (con dipendenza tra alu e tmu) per poi tirarne fuori una più veloce in cui le unità di calcolo sono indipendenti. Praticamente si vende due volte la stessa tecnologia. Non è escluso che anche nVIDIA possa aver fatto qualcosa del genere e che in un futuro chip si riproponga la stessa architettura dell'NV40, con alu e tmu indipendenti (magari passando agli 0.11 u)

DjLode
01-05-2004, 01:13
Originariamente inviato da yossarian
quelle cose manco le leggo o al massimo gli do un'occhiata veloce (tanto sono tutte cose già note oppure boiate pazzesche) ;)

Manco io leggo The Inquirer :)
Di solito leggo su un forum e in mezzo alle stupidate ci sono anche cose praticamente esatte, come il fatto che la 6800 usasse un Anisotropico di stampo Ati, cosa letta molto tempo prima che uscisse la rece.
Per il resto si tratta cmq di rumors :)

yossarian
01-05-2004, 03:38
Originariamente inviato da DjLode
Manco io leggo The Inquirer :)
Di solito leggo su un forum e in mezzo alle stupidate ci sono anche cose praticamente esatte, come il fatto che la 6800 usasse un Anisotropico di stampo Ati, cosa letta molto tempo prima che uscisse la rece.
Per il resto si tratta cmq di rumors :)

sai com'è, a forza di raccogliere voci a 360° qualcosa di vero si finisce anche con il riportarlo. Solo che spesso si finisce col dire tutto ed il contrario di tutto. Inoltre gli articoli di The Inquirer non sono a carettere tecnico e a me, sinceramente, le ultime cose che interessano sono i rumors a livello di frequenze di funzionamento, numero di pipeline, ecc.
Una volta che hai a disposizione uno schema di massima dell'architettura di un chip, i risultati di qualche bench sintetico che testi vari parametri (non certo il punteggio finale del 3DMark, tanto per intenderci) e qualche chip di riferimento con cui fare il confronto, si possono trarre tutte le conclusioni del caso sull'architettura di un chip e sul suo funzionamento. In alternativa o per integrare le proprie conclusioni e conoscenze, si può leggere qualche articolo o qualche discussione sul forum di B3D, oppure qualche articolo di 3DCenter o di x-bit labs (quest'ultimo soprattutto per le analisi accurate che fa sui filtri impiegati) o di Hardware.Fr; oppure qualche bella recensione in Italiano di HWUpgrade o di nV Italia.


;)

ATi7500
01-05-2004, 05:26
Originariamente inviato da yossarian
Altro dato mancante è la bontà degli algoritmi di compressione dati e di gestione della ram adoperati. Finora si è discusso come se si avesse a disposizione un bus illimitato. In realtà non è così; già con la precedente generazione si era visto che, in alcune situazioni, si iniziavano ad evidenziare problemi di limitazione in banda. Con l'attuale questi problemi saranno accentuati, perchè, raddoppiando le pipeline, si dimezza il canale di comunicazione con la ram riservato a ciascuna pipeline. E' vero che una architettura crossbar permette di minimizzare questo tipo di problema, però non sarà possibile aggirarlo. Se non si ricorresse a ram GDDR3 sarebbe impossibile far lavorare questi chip ad alte risoluzioni e con filtri attivi, senza "strangolarli"; e anche con le GDDR3 il problema è solo spostato un po' più in là, poichè l'aumento di bandwidth non va di pari passo con l'aumento della capacità di calcolo. Si può affermare che se si fosse rimasti alle ram DDR, con 16 pipeline si sarebbe dovuti ricorrere necessariamente al bus a 512 bit, per permettere a ciascuna pipeline di avere a disposizione un canale capace dello stesso quantitativo di dati trasferito nella precedente generazione di chip (uno dei conti della serva che si possono fare e che, all'atto pratico si fanno è il seguente: 4 pipeline e 128 bit con ram DDR equivalente ad un bus di 256 bit, danno 256/4=64; con 8 pipe e bus a 256 DDR si ha 512/8=64; con 16 pipe sarebbe necessario avere 1024/16=64, ossia bus a 512 bit DDR per mantenere lo stesso rapporto. Ovviamente l'aumento di frequenza delle ram e il miglioramento degli algoritmi di compressione e di gestione del memory bus permettono di avere qualche margine di tolleranza). Il motivo principale per cui non si è adottato un controller a 512 bit è che ciò avrebbe richiesto le revisione dell'intera architettura interna dei chip che sarebbero dovuti diventare a 1024 bit, contro i 512 attuali, per non creare colli di bottiglia a valle del memory bus controller.


ma allora non per forza le 16 pipe garantiranno un grosso margine sulle 12 (parlando d geffo6800ultra e liscia),
soprattutto se le frequenze ram della liscia saranno alte almeno come quelle della ultra :)


bYeZ!

yossarian
01-05-2004, 05:34
Originariamente inviato da ATi7500
ma allora non per forza le 16 pipe garantiranno un grosso margine sulle 12 (parlando d geffo6800ultra e liscia),
soprattutto se le frequenze ram della liscia saranno alte almeno come quelle della ultra :)


bYeZ!


guarda caso le versioni liscie avranno ram meno performanti

;)

ATi7500
01-05-2004, 05:59
Originariamente inviato da yossarian
guarda caso le versioni liscie avranno ram meno performanti

;)

li sta ai produttori decidere ;)


bYeZ!

nonikname
01-05-2004, 10:27
nVIDIA NV40 @ NVitalia (http://www.nvitalia.com/articoli/anteprima_NV40/1.htm)

devis
01-05-2004, 11:28
Originariamente inviato da andreamarra
Questo è il terzo demo, la nave :)



http://www.hothardware.com/reviews/images/nv40_debut/demos/NV_Clear_Sailing_02.jpg

Qualitativamente pessima. Texture del mare inesistenti, vele perfettamente piatte, texture del legno slavate.

Sembra un techdemo perfetto per una TNT2 :confused:

Dark Schneider
01-05-2004, 12:01
Originariamente inviato da yossarian
guarda caso le versioni liscie avranno ram meno performanti

;)


Però mi pare di ricordare più che altro in ambito DX8 questo, giusto? :)

Dark Schneider
01-05-2004, 12:02
Originariamente inviato da devis
Qualitativamente pessima. Texture del mare inesistenti, vele perfettamente piatte, texture del legno slavate.

Sembra un techdemo perfetto per una TNT2 :confused:


Invece se visto non è male :)