Nv40? [Archivio] - Hardware Upgrade Forum

fek

05-11-2003, 21:26

A giorni in tape out.
I primi sample interni nvidia saranno disponibili a dicembre e i primi sample esterni a gennaio.
Prevedono di andare in full production a marzo.

Sulla carta il chip e' mostruoso, dalle 2 alle 3 volte piu' veloce di un NV35, piena compatibilita' DX9.1 (vertex e pixel shader 3.0), 12 texture unit, tutta la pipeline fino alla RAMDAC e' fp16.

Non vedo l'ora :)

tiranium 4200

05-11-2003, 21:29

sulla carta l'nv30 si diceva faceva il triplo della 4600 al 3dmark, e bene o male ne fa 1000 punti in piu. quindi quello che hai scritto che va 2 o 3 volte di+ dell'nv35 c'è da commentarlo :)

fek

05-11-2003, 21:33

Questa volta mi fido abbastanza perche' non ho parlato con il reparto marketing (ogni buon reparto marketing e' noto per le suo sparate :)), ma con uno degli ingegneri del progetto che ci ha parlato per piu' di due ore dell'architettura e, a occhio, la stima di 2/3 volte e' plausibile.

Butta il 3DMark, non conta nulla...

Thunder82

05-11-2003, 21:37

Originariamente inviato da tiranium 4200
sulla carta l'nv30 si diceva faceva il triplo della 4600 al 3dmark, e bene o male ne fa 1000 punti in piu. quindi quello che hai scritto che va 2 o 3 volte di+ dell'nv35 c'è da commentarlo :)

Beh, effettivamente un 5800ultra al 3dmark2003 fa il triplo di una ti4600...

tiranium 4200

05-11-2003, 21:37

che il 3dmark nn vale na sega lo sappiamo tutti (immagino) però si sa che si essagera sempre sulle performance della scheda, matematicamente 4x2nv35 8x2 nv40 dice che è il doppio, ma c'è da vedere la bandwith e il resto, sara dura:cool:

MaBru

05-11-2003, 21:38

Originariamente inviato da fek
12 texture unit

Questo significa che è un 6x2? ;)

Mr.Gamer

05-11-2003, 21:38

...io ormai se non vedo non credo fek. ricordati questa regola, almeno in questo campo vale + dell'oro :ave: :read: :sborone:

tiranium 4200

05-11-2003, 21:39

Originariamente inviato da Thunder82
Beh, effettivamente un 5800ultra al 3dmark2003 fa il triplo di una ti4600...

:rotfl: certo, ma si parlava del 2001. e di 3,5 volte superiore in quake 3 arena, cioè cose assurde:D

Thunder82

05-11-2003, 21:43

Originariamente inviato da tiranium 4200
di 3,5 volte superiore in quake 3 arena, cioè cose assurde:D

Beh, potrebbe essere possibile, a 1600x1200 con AA4x e AF8x, adesso non ho bench sottomano quindi non saprei

david-1

05-11-2003, 21:45

12 texture unit????
cioè?? 6x2??

fek

05-11-2003, 21:55

Originariamente inviato da Mr.Gamer
...io ormai se non vedo non credo fek. ricordati questa regola, almeno in questo campo vale + dell'oro :ave: :read: :sborone:

Hai stra ragione :D
Se mi dicono che va 3 volte tanto non gli credo, se mi tengono li' a raccontarmi l'architettura per 4 ore, non ci credo ancora, ma gli concedo il beneficio del dubbio.

DjLode

05-11-2003, 22:01

Bhè ma "fino a 3 volte più veloce" vuol dire tutto e vuol dire niente :)
Infatti se si mette a 1600x1200 con AA 8x probabilmente si ottengono il triplo di fps e loro nell'affermazione ci sono stati. Insomma vanno sempre prese con le molle queste cose, che sia più veloce mi pare assodato, ma 3 volte più veloce (senza il "fino") vuol dire sempre e cmq... e come sappiamo non ha senso :)
Cmq Dicembre non è lontano...

Crashman

05-11-2003, 22:04

Marzo? Pensavo che l' nv40 sarebbe uscito un po' prima... Cmq se quello che dice fek è vero (e conoscendo la sua fama sul forum ci scommetterei la scheda mamma) Ati dovrà veramente impegnarsi molto per creare un chip all'altezza. Spero per nVidia che abbia abbandonato l'architettura con 2 texture unit per pipeline perchè nella maggior parte delle situazioni porta ad un gap appastanza considerevole rispetto ad una architettura a single texture unit. Ati insegna...

fek

05-11-2003, 22:21

Grazie dei complimenti :)

Non ricordo al 100% se ha 2 texture unite per pipe, ma mi sembra di no, perche' ha 12 pipeline. Non te lo do' al 100%, perche' non mi ricordo proprio in questo momento. Domani vado in ufficio e do' un'occhiata alle slide che ci hanno dato e te lo dico.

Comunque l'architettura a quad e' rimasta, quindi continuano a processare un quad (quattro pixel) per pipeline contemporaneamente.
La differenza qui rispetto all'NV35 e' che ad ogni stadio della pipeline possono eseguire 1 istruzione matematica, 1 accesso a texture, 1 istruzione matematica (e di mezzo ci possono mettere una normalizzazione fp16 gratuita).

Quindi ne esce una configurazione 1M/1T/1M rispetto al 2M/2T dell'NV35 che mappa in maniera piu' naturale l'output di HLSL. In parole povere dovrebbe ridurre di molto la necessita' di particolari ottimizzazioni dei pixel shader che sono richieste dall'NV35 per fornire le istruzioni nel formato che piu' lo aggrada.

tiranium 4200

05-11-2003, 22:23

ma 12x1 mi sembra sara r420 e 8x2 nv40, se è cosi ancora ati la vincera, perchè come ora quell 8x2 nn verra sfruttato in tutti i giochi ma solo in alcuni, quindi è prattiacamente un 12x1(ati) 8x1(2)(nvidia)

fek

05-11-2003, 22:30

Sono ragionevolmente sicuro che sia un 12x1, ma domani ve lo confermo al 100%.

Una nota simpatica: ci hanno detto che nel giro di un paio di generazioni prevedono di salire a cose tipo 256 pipeline in parallelo!

DjLode

05-11-2003, 22:32

Bhè cacchio, da 12 a 256 il salto è un "pochino" alto :)
Vabbhè che ad esagerare si fa sempre in tempo... Però con la tecnologia attuale un chip del genere cosa verrebbe fuori? 2 metri quadri?

Thunder82

05-11-2003, 22:37

Originariamente inviato da fek
Sono ragionevolmente sicuro che sia un 12x1, ma domani ve lo confermo al 100%.

Una nota simpatica: ci hanno detto che nel giro di un paio di generazioni prevedono di salire a cose tipo 256 pipeline in parallelo!

Scusa ma queste cose come fai a saperle?
:confused:

MaBru

05-11-2003, 22:44

Originariamente inviato da Thunder82
Scusa ma queste cose come fai a saperle?
:confused:

Mai hai letto tutto il thread? :confused:

Thunder82

05-11-2003, 22:46

Originariamente inviato da MaBru
Mai hai letto tutto il thread? :confused:

Mi era sfuggito un post
:D :)

octopus

05-11-2003, 23:51

Originariamente inviato da fek
...di salire a cose tipo 256 pipeline in parallelo!...

3 ... 2 ... 1 ... ignition!

Evvai ... è partito uno Shuttle !
:D :sofico:

REPSOL

06-11-2003, 03:15

Originariamente inviato da octopus
3 ... 2 ... 1 ... ignition!

Evvai ... è partito uno Shuttle !
:D :sofico:

AIHAIHAIAHIAH :D 256 pipeline che bus per le memorie gli metti? LOLOLOL

Se veramente è 12x1 è un buon chip, ma conoscendo la nvidia secondo me è più propenso verso 1,5nv30 (per chi non avesse capito intendo 6x2).

Per darle a 6x2 basta una 9800XT a 0,13micron oc fino alle stelle e ram con le controballs :D

Cmq a che data hai detto? Marzo? Ok io mi preparo per fine 2004 inizio 2005 poi fate voi :D

Stò scherzando dai non prendetelo come un flame ;)

Ciaoz

yossarian

06-11-2003, 07:52

Originariamente inviato da fek
Grazie dei complimenti :)

Non ricordo al 100% se ha 2 texture unite per pipe, ma mi sembra di no, perche' ha 12 pipeline. Non te lo do' al 100%, perche' non mi ricordo proprio in questo momento. Domani vado in ufficio e do' un'occhiata alle slide che ci hanno dato e te lo dico.

Comunque l'architettura a quad e' rimasta, quindi continuano a processare un quad (quattro pixel) per pipeline contemporaneamente.
La differenza qui rispetto all'NV35 e' che ad ogni stadio della pipeline possono eseguire 1 istruzione matematica, 1 accesso a texture, 1 istruzione matematica (e di mezzo ci possono mettere una normalizzazione fp16 gratuita).

Quindi ne esce una configurazione 1M/1T/1M rispetto al 2M/2T dell'NV35 che mappa in maniera piu' naturale l'output di HLSL. In parole povere dovrebbe ridurre di molto la necessita' di particolari ottimizzazioni dei pixel shader che sono richieste dall'NV35 per fornire le istruzioni nel formato che piu' lo aggrada.

a parte il discorso sull'ottimizzazione delle sequenze di operazioni interne, su cui non si può non essere d'accordo, ci sono alcune cose da chiarire.
Qual è il vantaggio di utilizzare ancora quad 2*2 se il numero di pipelines è aumentato? Nell'NV3x sappiamo che il quad 2*2, prima di essere indirizzato alle unità di calcolo, viene splittato in 4 pixels che procedono in parallelo, quindi uno per ogni pipeline vera e propria; sappiamo anche che il limite al numero di quad che possono entrare nelle pipelines è determinato dalla capacità dei registri interni, per cui non è possibile immettere nuovi quad all'interno delle pipelines se non si sono, nel frattempo, liberate almeno alcune delle unità di calcolo e i relativi registri temporanei in cui caricare i nuovi dati, così come non è possibile far eseguire ad un pixel un secondo ciclo (nel caso di multipass elaboration) qualora le unità di calcolo e i relativi registri posti in cima alla pipeline siano ancora occupati (l'efficienza dei cicli di loop back è fondamentale nelle recirculating pipelines). Sappiamo infine che la gran parte dei problemi della serei NV3x nasce proprio dall'insufficienza di spazio in questi registri temporanei che non permette l'utilizzo di più quad in contemporanea ad altre istruzioni (di tipo texture fetch, ad esempio).
Fatta questa premessa, il vantaggio dell'utilizzo di quad in input, al posto di singoli pixels risiede nel fatto che è possibile modificare le dimensioni di questi quad, senza apportare modifiche all'architettura della pipeline (ovviamente in presenza di row list dove stivare i dati in "attesa"). Perciò non vedo il vantaggio di continuare ad utilizzare quad 2*2 aumentando il numero delle pipelines fisiche e, di conseguenza, il numero delle unità di calcolo. Cioè, in poche parole, non vedo il vantaggio di prelevare dati a gruppi di 4, quando, se in effetti l'architettura fosse una 12x1, potrebbero essere prelevati a gruppi di 12 o anche di più; questo, a meno che non si parli di quad di diverse dimensioni (esempio 4*4, 6*6 o, addirittura, 12*12), oppure di gruppi di 3 quad 2*2 per volta.

Altra perplessità riguarda l'utilizzo di FP16 su tutta la pipeline, fino al frame buffer. Questo significa rinuncia ad elaborare in FP32 o anche in FP24 che è, in diversi casi, il minimo richiesto per DX9 (a tal proposito, faccio presente che le specifiche iniziali prevedevano l'uso di FP16 solo in caso di dependent read), nonchè una delle due modalità (quella a maggior precisione) prevista dall'ARB2 per le specifiche OpenGL1.4 e successive (specifiche che si basano a loro volta su quelle dell'IEEE)?
Il ricorso alla partial precision presuppone, di nuovo, l'utilizzo di buffer interni di tipo 8 bit INT?

ciao

yossarian

06-11-2003, 08:01

Originariamente inviato da fek
Sono ragionevolmente sicuro che sia un 12x1, ma domani ve lo confermo al 100%.

Una nota simpatica: ci hanno detto che nel giro di un paio di generazioni prevedono di salire a cose tipo 256 pipeline in parallelo!

non si tratta di 256 pipelines fisiche, così come siamo abituati a considerarle dall'analisi degli attuali chip, ma di 256 pipelines virtuali, ossia di una serie di unità di calcolo scalari, probabilmente FP32 (ma anche FP16 o FP24), disposte in più array, in configurazione SIMD o MIMD, in grado di emulare il funzionamento di 256 pipelines tradizionali. Il numero di queste unità potrebbe aggirarsi intorno a qualche centinaio, ma la cosa non deve meravigliare più di tanto se si pensa che un chip come l'R3x0 ha qualcosa come circa 120 unità (tra FP24, FP32 e FX16) funzionanti, però, in modalità vec, anzichè scalar.

ciao

fek

06-11-2003, 10:07

Originariamente inviato da yossarian
a parte il discorso sull'ottimizzazione delle sequenze di operazioni interne, su cui non si può non essere d'accordo, ci sono alcune cose da chiarire.
Qual è il vantaggio di utilizzare ancora quad 2*2 se il numero di pipelines è aumentato? Nell'NV3x sappiamo che il quad 2*2, prima di essere indirizzato alle unità di calcolo, viene splittato in 4 pixels che procedono in parallelo, quindi uno per ogni pipeline vera e propria; sappiamo anche che il limite al numero di quad che possono entrare nelle pipelines è determinato dalla capacità dei registri interni, per cui non è possibile immettere nuovi quad all'interno delle pipelines se non si sono, nel frattempo, liberate almeno alcune delle unità di calcolo e i relativi registri temporanei in cui caricare i nuovi dati, così come non è possibile far eseguire ad un pixel un secondo ciclo (nel caso di multipass elaboration) qualora le unità di calcolo e i relativi registri posti in cima alla pipeline siano ancora occupati (l'efficienza dei cicli di loop back è fondamentale nelle recirculating pipelines).

Si', anch'io nutro dei dubbi sull'architettura a quad, ma piu' per il futuro che per il presente. Loro dicono che nei giochi attuali, solo in meno del 3% dei casi, uno dei 4 pixel del quad porta ad uno stallo, infatti ci hanno chiaramente detto di salire col numero di poligoni per scena, perche' c'e' ancora spazio di lavoro.
Ma quando ci si avvicinera' in futuro (1/2 generazioni) al fatidico rapporto 1 triangolo/1 pixel, allora l'architettura a quad darebbe tutti i problemi che hai elencato e andrebbe sicuramente sostituita.
Mia previsione personale, l'NV50 non usera' i quad.

Cioè, in poche parole, non vedo il vantaggio di prelevare dati a gruppi di 4, quando, se in effetti l'architettura fosse una 12x1, potrebbero essere prelevati a gruppi di 12 o anche di più; questo, a meno che non si parli di quad di diverse dimensioni (esempio 4*4, 6*6 o, addirittura, 12*12), oppure di gruppi di 3 quad 2*2 per volta.

Il problema sta appunto nella dimensione dei triangoli, perche' il quad deve appartenere allo stesso triangolo o, meglio, ogni pixel deve usare lo stesso pixel shader, per ovvi motivi visto che passano per la stessa pipeline. Una precisazione, a quanto ci hanno detto una pipeline e' alimentata da un quad che non viene splittato in 4.

Altra perplessità riguarda l'utilizzo di FP16 su tutta la pipeline, fino al frame buffer. Questo significa rinuncia ad elaborare in FP32 o anche in FP24 che è, in diversi casi, il minimo richiesto per DX9 (a tal proposito, faccio presente che le specifiche iniziali prevedevano l'uso di FP16 solo in caso di dependent read), nonchè una delle due modalità (quella a maggior precisione) prevista dall'ARB2 per le specifiche OpenGL1.4 e successive (specifiche che si basano a loro volta su quelle dell'IEEE)?

Ne avevamo gia' parlato tempo fa se non mi sbaglio, le specifiche DX9 richiedono i 16 bit tassativi e consigliano 24/32.
Quando parlo di fp16 per tutta la pipeline di rendering, intendo che anche il framebuffer ora puo' essere fp16 e l'unita' di blend lavora anche su fp16 fino allo scanout del framebuffer che puo' avvenire a fp16! Tecnicamente e' possibile scrivere un gioco intero che su NV40 non passi mai per RGB interi neppure per il RAMDAC!

Quindi gli fp16 sono un cosiddetto "first class citizen" all'interno dell'NV40, ma questo non vuol dire che l'fp32 e' abbandonato all'interno del pixel shader, anzi.
Come ben sai, se esco con un risultato a 16 bit di precisione, e' meglio che faccia i calcoli intermedi a 32 per ottenere la precisione desiderata (per contenere la propagazione dell'errore).
Ovviamente l'NV40 e' ottimizzato per l'esecuzione dei pixel shader in fp16 e permette l'uso dell'fp32 laddove la precisione lo necessiti. Personalmente approvo questa architettura senza alcun riserbo.

Il ricorso alla partial precision presuppone, di nuovo, l'utilizzo di buffer interni di tipo 8 bit INT?

ciao

Non te lo so dire. Non sono stati nominati.

fek

06-11-2003, 10:09

Originariamente inviato da yossarian
non si tratta di 256 pipelines fisiche, così come siamo abituati a considerarle dall'analisi degli attuali chip, ma di 256 pipelines virtuali, ossia di una serie di unità di calcolo scalari, probabilmente FP32 (ma anche FP16 o FP24), disposte in più array, in configurazione SIMD o MIMD, in grado di emulare il funzionamento di 256 pipelines tradizionali. Il numero di queste unità potrebbe aggirarsi intorno a qualche centinaio, ma la cosa non deve meravigliare più di tanto se si pensa che un chip come l'R3x0 ha qualcosa come circa 120 unità (tra FP24, FP32 e FX16) funzionanti, però, in modalità vec, anzichè scalar.

ciao

No no. Parlano proprio di 256 pipeline fisiche! (Nel giro di 4/5 anni)

yossarian

06-11-2003, 10:11

Originariamente inviato da fek
Si', anch'io nutro dei dubbi sull'architettura a quad, ma piu' per il futuro che per il presente. Loro dicono che nei giochi attuali, solo in meno del 3% dei casi, uno dei 4 pixel del quad porta ad uno stallo, infatti ci hanno chiaramente detto di salire col numero di poligoni per scena, perche' c'e' ancora spazio di lavoro.
Ma quando ci si avvicinera' in futuro (1/2 generazioni) al fatidico rapporto 1 triangolo/1 pixel, allora l'architettura a quad darebbe tutti i problemi che hai elencato e andrebbe sicuramente sostituita.
Mia previsione personale, l'NV50 non usera' i quad.

Il problema sta appunto nella dimensione dei triangoli, perche' il quad deve appartenere allo stesso triangolo o, meglio, ogni pixel deve usare lo stesso pixel shader, per ovvi motivi visto che passano per la stessa pipeline. Una precisazione, a quanto ci hanno detto una pipeline e' alimentata da un quad che non viene splittato in 4.

Ne avevamo gia' parlato tempo fa se non mi sbaglio, le specifiche DX9 richiedono i 16 bit tassativi e consigliano 24/32.
Quando parlo di fp16 per tutta la pipeline di rendering, intendo che anche il framebuffer ora puo' essere fp16 e l'unita' di blend lavora anche su fp16 fino allo scanout del framebuffer che puo' avvenire a fp16! Tecnicamente e' possibile scrivere un gioco intero che su NV40 non passi mai per RGB interi neppure per il RAMDAC!

Quindi gli fp16 sono un cosiddetto "first class citizen" all'interno dell'NV40, ma questo non vuol dire che l'fp32 e' abbandonato all'interno del pixel shader, anzi.
Come ben sai, se esco con un risultato a 16 bit di precisione, e' meglio che faccia i calcoli intermedi a 32 per ottenere la precisione desiderata (per contenere la propagazione dell'errore).
Ovviamente l'NV40 e' ottimizzato per l'esecuzione dei pixel shader in fp16 e permette l'uso dell'fp32 laddove la precisione lo necessiti. Personalmente approvo questa architettura senza alcun riserbo.

Non te lo so dire. Non sono stati nominati.

ok, grazie per le info

Quindi, in questo caso, si avrebbe effettivamente un input in forma di quad (mentre nella serie NV3x, sapevo che l'input era di tipo misto: quad prima e singoli pixels poi).
In effetti, capisco che le scelta dei quad sia dettata dal fatto che permettono di modificare la quantità di dati in ingresso senza modificare fisicamente la pipeline, però restano le perplessità sulla possibilità che si possano creare situazioni di stallo; c'è da augurarsi che stavolta abbiano lavorato bene nel dimensionare i registri che rappresentano l'elemento critico nelle elaborazioni multipass, soprattutto vista l'intenzione di far lavorare il chip con un gran numero di parametri contemporaneamente.

ciao

:)

prova

06-11-2003, 10:36

Citazione:

Ah, Don Abbondio e il suo latinorum!

:D

fek

06-11-2003, 10:38

Originariamente inviato da yossarian
ok, grazie per le info

Quindi, in questo caso, si avrebbe effettivamente un input in forma di quad (mentre nella serie NV3x, sapevo che l'input era di tipo misto: quad prima e singoli pixels poi).
In effetti, capisco che le scelta dei quad sia dettata dal fatto che permettono di modificare la quantità di dati in ingresso senza modificare fisicamente la pipeline, però restano le perplessità sulla possibilità che si possano creare situazioni di stallo; c'è da augurarsi che stavolta abbiano lavorato bene nel dimensionare i registri che rappresentano l'elemento critico nelle elaborazioni multipass, soprattutto vista l'intenzione di far lavorare il chip con un gran numero di parametri contemporaneamente.

ciao

:)

Si', la tua analisi e' corretta :)

Approposito, confermo il 12x1 dell'NV40.

yossarian

06-11-2003, 10:43

Originariamente inviato da fek
No no. Parlano proprio di 256 pipeline fisiche! (Nel giro di 4/5 anni)

questa la vedo un po' più difficile; sicuramente non ci si arriverà con la tecnologia a 0,09 u e qualche dubbio lo nutro anche relativamente a quella a 0,065, perchè si parla di pipelines piuttosto lunghe e complesse, formate da molte unità di calcolo in serie.

DeMonViTo

06-11-2003, 10:49

fek sai nulla di ati? :D

xpiuma

06-11-2003, 11:01

:ave: :ave: :ave:

Ragazzi, ma quante ne sapete?
COmplimenti per la preparazione, e grazie per aver postato qui queste cose, cosi che noi poveri mortali possiamo impararne di più...
Ma fek, ho capito che fai il programmatore di giochi, dove?
Se non vuoi/puoi rispondermi non fa niente, ma... grande!

yossarian

06-11-2003, 11:08

Originariamente inviato da prova
Citazione:

Ah, Don Abbondio e il suo latinorum!

:D

forse ti riferisci a quadra, quadrae, sostantivo femminile, prima declinazione (quadrato), plurale quadrae?

io, invece parlavo di QUAD (quadrato) genere neutro; lingua Inglese.

:D

yossarian

06-11-2003, 11:12

Originariamente inviato da xpiuma
:ave: :ave: :ave:

Ragazzi, ma quante ne sapete?
COmplimenti per la preparazione, e grazie per aver postato qui queste cose, cosi che noi poveri mortali possiamo impararne di più...
Ma fek, ho capito che fai il programmatore di giochi, dove?
Se non vuoi/puoi rispondermi non fa niente, ma... grande!

ce l'ha scritto in sign

ciao ;)

fek

06-11-2003, 11:17

Pero' cosi' mi fate arrossire :kiss:

DjLode

06-11-2003, 11:22

Potete spiegare un pò meglio il fatto di avere 16bit per tutta la pipeline? Perchè ieri sera volevo fare la stessa annotazione di yoss (niente 32bit), ma mi sono trattenuto perchè mi pareva strano. Ora fek ha ribadito che nelle unità pixel i 32bit rimangono, mi sfugge il motivo di fare calcoli a 32bit e poi buttarli fuori a 16bit (se è così che si ragione) o mi sfugge tutto nel caso che quello che ho detto prima non sia la realta.
Sempre con calma e per piacere :)

xpiuma

06-11-2003, 11:23

Il mio dove voleva risalire al luogo... penso di essermi espresso male.
Intendo: gli studi lionhead sono qui in Italia? Milano? Roma? Casalpusterlengo?

halduemilauno

06-11-2003, 11:28

Originariamente inviato da xpiuma
Il mio dove voleva risalire al luogo... penso di essermi espresso male.
Intendo: gli studi lionhead sono qui in Italia? Milano? Roma? Casalpusterlengo?

Godalming, Surrey, UK
cosi è scritto.
;)

fek

06-11-2003, 11:33

Originariamente inviato da xpiuma
Il mio dove voleva risalire al luogo... penso di essermi espresso male.
Intendo: gli studi lionhead sono qui in Italia? Milano? Roma? Casalpusterlengo?

Scusa, non avevo capito la domanda :)
Lavoro a Guildford in UK, e' poco sotto Londra, dove anni fa progettavano la Ferrari. Purtroppo niente studi in Italia :(

yossarian

06-11-2003, 11:36

Originariamente inviato da DjLode
Potete spiegare un pò meglio il fatto di avere 16bit per tutta la pipeline? Perchè ieri sera volevo fare la stessa annotazione di yoss (niente 32bit), ma mi sono trattenuto perchè mi pareva strano. Ora fek ha ribadito che nelle unità pixel i 32bit rimangono, mi sfugge il motivo di fare calcoli a 32bit e poi buttarli fuori a 16bit (se è così che si ragione) o mi sfugge tutto nel caso che quello che ho detto prima non sia la realta.
Sempre con calma e per piacere :)

si parla di 16 bit fp anche nella RAMDAC dove, attualmente, le FX lavorano a 8 bit per canale e le Radeon, la Parhelia e il VP10 a 10 bit per canale (4 per il canale alfa) in INT. I calcoli a 32 bit sono necessari, in alcuni casi, per ridurre al minimo gli errori provocati da arrotondamenti successivi, mentre, una volta ottenuto l'ultimo risultato (quello che deve essere visualizzato), è possibile operare un troncamento, senza apprezzabile perdita di qualità. Il problema dei calcoli a bassa precisione non è nel singolo valore approssimato, ma nel fatto che questa approssimazione può produrre errori sempre più grandi, qualora quel valore debba essere riutilizzato per calcoli successivi.

ciao Dj

DjLode

06-11-2003, 11:43

Originariamente inviato da yossarian

si parla di 16 bit fp anche nella RAMDAC dove, attualmente, le FX lavorano a 8 bit per canale e le Radeon, la Parhelia e il VP10 a 10 bit per canale (4 per il canale alfa) in INT.
[/B]

Bhè, quindi sarebbe un bel passo in avanti? La precisione al confronto di quella attuale sarebbe enormemente più alta.

Il problema dei calcoli a bassa precisione non è nel singolo valore approssimato, ma nel fatto che questa approssimazione può produrre errori sempre più grandi, qualora quel valore debba essere riutilizzato per calcoli successivi.

Analisi in avanti degli errori, grafi, e operazioni floating point: Calcolo numerico 1 :muro:

ciao Dj

:) Ciao Ciao

fek

06-11-2003, 11:50

Originariamente inviato da DjLode
Bhè, quindi sarebbe un bel passo in avanti? La precisione al confronto di quella attuale sarebbe enormemente più alta.

Non e' tanto la precisione a cambiare, ma il range dinamico... HDR lighting di HL2 tutto in hw fino allo scanout? ;)

checo

06-11-2003, 11:52

Originariamente inviato da tiranium 4200
:rotfl: certo, ma si parlava del 2001. e di 3,5 volte superiore in quake 3 arena, cioè cose assurde:D

con aa ed aniso è vero :D

checo

06-11-2003, 12:02

Originariamente inviato da fek
Pero' cosi' mi fate arrossire :kiss:

clicca sulla mia signa e iscriviti a lithium :D
scusa ma ma uno col tuo know-how non capita tutti i giorni, già c'è yos, ma due is megli che uan :D

fek

06-11-2003, 12:11

yos e' impressionante. Rispetto a me lui ha un'ottimo know-how sull'hardware, mentre io sono solo un programmatore ed il poco che so sull'hardware deriva dall'universita'.

yossarian

06-11-2003, 12:22

Originariamente inviato da fek
yos e' impressionante. Rispetto a me lui ha un'ottimo know-how sull'hardware, mentre io sono solo un programmatore ed il poco che so sull'hardware deriva dall'universita'.

per me è l'esatto contrario: il poco che so di programmazione l'ho imparato all'università e in qualche ambiente di lavoro (dovendo conoscere la logica di funzionamento di certi dispositivi si finisce con l'apprendere anche qualcosa sul loro linguaggio).
Non è per piaggeria, però è da un po' che sto pensando al fatto che mi piacerebbe lavorare nel mondo dei videogames.
Magari potresti darmi qualche dritta su qualche testo o materiale illustrativo vario.

:)

Lord Archimonde

06-11-2003, 12:43

:eek: :eek:
:ave: un inchino ai maestri :ave:

(o preferiscono un brindisi :cincin: !):D

fek

06-11-2003, 13:03

Vada per la birra :D

yossarian

06-11-2003, 13:05

:ubriachi: :D

Thunder82

06-11-2003, 13:13

Originariamente inviato da fek
Vada per la birra :D

Stai lavorando a Black&White 2?
:)

A che punto sono i lavori?

Lord Archimonde

06-11-2003, 13:40

Originariamente inviato da fek
Vada per la birra :D

:D Certo che ne deve scorrere li' da voi!:hic:

Thunder82

Siamo vicini di...casa (beh, non proprio)
Sto giusto andando a PD all'uni

Thunder82

06-11-2003, 13:44

Originariamente inviato da Lord Archimonde
:D Certo che ne deve scorrere li' da voi!:hic:

Thunder82

Siamo vicini di...casa (beh, non proprio)
Sto giusto andando a PD all'uni

Anche io vado all'uni a PD
:)

DjLode

06-11-2003, 13:47

Originariamente inviato da fek
Non e' tanto la precisione a cambiare, ma il range dinamico... HDR lighting di HL2 tutto in hw fino allo scanout? ;)

Renditi sempre conto che stai parlando con un ignorante :)
Puoi tradurre in simil italiano (anche ad icone mi va bene purchè sia un pelo più comprensibile :)).

fek

06-11-2003, 14:01

Originariamente inviato da Thunder82
Stai lavorando a Black&White 2?
:)

A che punto sono i lavori?

Ehehe... non posso rispondere e cmq sarebbe OT ;)
Ieri ho scritto un post riguardo a BW2 sul forum che parla di giochi comunque. Ci sono degli sshot e un video.

Originariamente inviato da DjLode
Renditi sempre conto che stai parlando con un ignorante :)
Puoi tradurre in simil italiano (anche ad icone mi va bene purchè sia un pelo più comprensibile :)).

Ooops, scusami :)

I colori sono stati sempre rappresentati con numeri che vanno da 0.0 a 1.0 per le componenti RGB.
(1.0, 0.0, 0.0) e' rosso pieno
(1.0, 0.0, 1.0) e' magenta
Etc. etc.

Ma che cosa accade se nella scena ho delle zone molto luminose e altre zone molto buie?
Che se rappresento con 1.0 le zone molto luminose, non ho abbastanza "range" per rappresentare le zone molto scure e avro' li' un nero diffuso che non mi mostra i particolari, proprio perche' non ho piu' precisione in quella zona se uso gli interi.

Usare i floating point risolve il problema, perche' in fp posso rappresentare comodamente numeri tipo 100.0 (aumento il range). Quindi posso dire che la zona molto luminosa ha colori attorno al 100.0 di intensita' e la zona scusa attorno allo 0.0 di intensita'. La rappresentazione in floating point mi assicura una precisione ottimale per rappresentare le due intensita'.

Ci pensera' poi la scheda (NV40) ad elaborare i valori in fp da mandare a video per la visualizzazione. Oggi quest'ultimo passo viene fatto a mano.

E' piu' o meno quello che accade (molto semplificato) quando si abilitera' l'HDR rendering in HL2.

Codename87

06-11-2003, 14:09

Si sà niente sul sistema di raffreddamento?
Ciao

P.s.: fek, sei programmatore nei Lionhead Studios?
E' stato difficile diventarlo?
Sono interessato perchè vorrei farei anch'io il programmatore di videogiochi.

Thunder82

06-11-2003, 14:17

Black&White 2 userà le feature delle schede dx9?
Ho visto qualche screen e mi pare un'ottima grafica, un netto miglioramento rispetto all'1!

fek

06-11-2003, 14:18

Originariamente inviato da Codename87
Si sà niente sul sistema di raffreddamento?
Ciao

No, sorry.

P.s.: fek, sei programmatore nei Lionhead Studios?
E' stato difficile diventarlo?
Sono interessato perchè vorrei farei anch'io il programmatore di videogiochi.

Tanta fortuna.
Pero' preferirei parlare di hw qui ;)
Comunque puoi contattarmi in privato quando vuoi, saro' felice di darti qualche dritta.

Originariamente inviato da Thunder82
Black&White 2 userà le feature delle schede dx9?
Ho visto qualche screen e mi pare un'ottima grafica, un netto miglioramento rispetto all'1!

Non posso rispondere sorry.
Pero' da qualche parte ho scritto che ho lavorato su uno shader con piu' di 4 accessi a texture quindi dovrebbe darti un suggerimento ;)

-=Krynn=-

06-11-2003, 14:20

tornando al discorso delle 256 pipeline in parallelo (fisiche)(lo so, ma il post l'ho letto solo ora...:oink: ) non penso che riusciranno a farle nemmeno con la tecnologia a 0.065.
Una pipeline occupa una gran quantità di spazio sul chip, anche riducendone le dimensioni coll'affinarsi dell'integrazione 256 mi paiono cmq troppe, considerando anche che sicuramente avranno funzionalità ampliate rispetto a quelle attuali.

Poi la tua data (tra qualche generazione) è ambigua: cosa intendono per "tra qualche generazione".
Perchè se loro intendono 10 ci può anche stare, ma qua da me viene inteso con 2, massimo 3 generazioni a partire da quella attuale...

fek

06-11-2003, 14:25

Originariamente inviato da -=Krynn=-
Poi la tua data (tra qualche generazione) è ambigua: cosa intendono per "tra qualche generazione".
Perchè se loro intendono 10 ci può anche stare, ma qua da me viene inteso con 2, massimo 3 generazioni a partire da quella attuale...

Problemi loro in fondo :D
Loro hanno parlato di "qualche generazione", tipo 4 o 5 anni. Ovviamente non sono stati troppo precisi.

supermario

06-11-2003, 14:37

innanzitutto complimenti per le conoscenze a entrambi(ne sapete quasi quanto me :D:D:sofico: )

skerzo!:ave: :ave: :ave: :ave:

si sa nulla sulle frequenze e sul quantitativo/tipo di memoria?
fek tu giudichi l'nv40 un passo in avanti "serio"(tipo geffo2->3) o solo un boost all'nv3x?

grazie e ciao

fek

06-11-2003, 14:42

Passo avanti molto serio. Si possono rimettere in pari con ATI. Ora sono dietro di un buon margine.

supermario

06-11-2003, 14:44

e per quanto riguarda frequenze e memorie?:)

fek

06-11-2003, 14:45

Supporto DDR3. Non so nulla riguardo le freq.

yossarian

06-11-2003, 14:46

Originariamente inviato da supermario
innanzitutto complimenti per le conoscenze a entrambi(ne sapete quasi quanto me :D:D:sofico: )

skerzo!:ave: :ave: :ave: :ave:

si sa nulla sulle frequenze e sul quantitativo/tipo di memoria?
fek tu giudichi l'nv40 un passo in avanti "serio"(tipo geffo2->3) o solo un boost all'nv3x?

grazie e ciao

rispetto a NV3x è un chip completamente diverso; come ha detto fek, c'è la possibilità che la gara si svolga su un binario paritario adesso. Bisognerà vedere la risposta di ATi.

supermario

06-11-2003, 14:46

azz DDR3!:eek:

ma che collaudino bene le 2 prima!!!:D

ciauz

yossarian

06-11-2003, 14:52

Originariamente inviato da fek
Supporto DDR3. Non so nulla riguardo le freq.

con le GDDR3, che io sappia, si è arrivati a frequenze di trasferimento dati di 1600 Mhz, equivalenti a 200 Mhz di DRAM core frequency, anchew se non credo che saranno utilizzate le 200 Mhz sull'NV40 (presentavano ancora, fino a poco tempo fa, qualche problema di stabilità). Sono ipotizzabili GDDR3 da 150 Mhz di core frequency (1200 Mhz di bit rate) come massimo. A meno che, nel frattempo, non si risolvano definitivamente i suddetti problemi e questa tecnologia sia venduta ad un prezzo "abbordabile".

fek

06-11-2003, 14:55

Il prezzo. Questa e' interessante. Ci hanno detto che il prezzo di ingresso per le schede di fascia alta era un tempo $299, con l'ultima generazione si e' alzato a $399. Sono certi che a $499 e' invendibile, quindi pensano che la tendenza torni ad essere $299 nel giro di un po' di tempo. Sicuramente non piu' di $399.

Buone notizie :)

shambler1

06-11-2003, 15:07

sarà compatibile con lo slot agp? questo mi interessa.

fek

06-11-2003, 15:32

Versione AGP e PCI-E (quando disponibile)

museman

06-11-2003, 16:43

Grande!!!!!!!!!!!
Secondo me il momento più esaltante (ed erudito) del forum è stato quando si incominciavano ad intravedere le caratteristche del chip nv 30.
Bhe sono quasi commosso dal constatare che con l'uscita di nv40 ed r420 alle porte si stanno ripetendo quei momenti :cry:

checo

06-11-2003, 16:44

speriamo non si ripetano pure i flame :D

museman

06-11-2003, 17:17

speriamo non si ripetano pure i flame
Certo lo spero anch'io:mad:

pon 87

06-11-2003, 17:21

quando sarà disponibile in italia=?:)

pon 87

06-11-2003, 17:22

Originariamente inviato da fek
Il prezzo. Questa e' interessante. Ci hanno detto che il prezzo di ingresso per le schede di fascia alta era un tempo $299, con l'ultima generazione si e' alzato a $399. Sono certi che a $499 e' invendibile, quindi pensano che la tendenza torni ad essere $299 nel giro di un po' di tempo. Sicuramente non piu' di $399.

Buone notizie :)
ottimo sarà mia:sofico:

-=Krynn=-

06-11-2003, 17:26

piuttosto, ma da voi alla LionHead studios vengono solo gli ingegneri nvidia?
Si sa nulla dell'r420 di Ati?

CS25

06-11-2003, 18:09

Originariamente inviato da museman
speriamo non si ripetano pure i flame
Certo lo spero anch'io:mad:

Finche' certi elementi si terranno alla larga dalla discussione, avremo garanzia di uno spessore tecnico notevole e di una volonta' comune di far _capire_ cio' che viene detto :)
Ma per queste evenienze basta segnalare al buon Raven e tutto viene sistemato :D

luckye

06-11-2003, 19:49

E un pò ot ma ingegneristicamente parlando spero che l'nv40 possa essere erede del Geforce 256 e del Geforce 3 da sempre nel mio cuore :cool:

DjLode

06-11-2003, 20:25

Originariamente inviato da fek
Usare i floating point risolve il problema, perche' in fp posso rappresentare comodamente numeri tipo 100.0 (aumento il range). Quindi posso dire che la zona molto luminosa ha colori attorno al 100.0 di intensita' e la zona scusa attorno allo 0.0 di intensita'. La rappresentazione in floating point mi assicura una precisione ottimale per rappresentare le due intensita'.

Ok, era più o meno quello che avevo capito io, e cioè una maggiore precisione nella rappresentazione dei colori o delle loro intensità. Insomma quello che tu chiami range :)
Grazie.

Domanda sulle memoria in generale. Io ho sempre saputo che le ddr2 (quelle della 5800 per intenderci) erano paragonabili a fronte di una minor frequenza ad una ddr 2 volte più veloce (in italiano, una ddr2 da 250mhz come quella della 5800 era paragonabile ad una ddr da 500mhz e quindi ram a 1000mhz in sdr. Sempre se non ricordo male) però introducevano latenze maggiori alle ddr. Quindi numericamente parlando una ddr2 da 1ghz era più lenta di una ddr da 1ghz.
Le gddr3 se non ricordo male erano quelle al cui sviluppo partecipò anche Ati proprio quando Nvidia annunciò di appoggiarsi alle ddr2. Qualcuno riassume in soldoni cosa comportano o mi da anche un link e mi conferma se rimangono i "problemi" di cui sopra (e quindi se una gdde3 da 200mhz come quella nominata da yossarian risulterebbe cmq meno veloce di una eventuale ddr ad 1.6ghz)?

Mecoita

07-11-2003, 07:45

Fek : da notizie girate in rete sembra che nV abbia aumentato parecchio l'efficenza nell'utilizzo della banda passante sull'nv40 rispetto le precedenti generazioni di chip. Sai qualcosa di più al riguardo ?

Raven

07-11-2003, 08:01

Originariamente inviato da CS25
Ma per queste evenienze basta segnalare al buon Raven e tutto viene sistemato :D

:D ;)

Custode

07-11-2003, 09:24

Discussione a dir poco fantastica, questa.
Ciao fek, senti, andrò sicuramente OT, ma questa te la devo chiedere, anche se poi non so se tu possa rispondere o meno:
appurato che lavorare alla Lionhead sia un sogno, ti ritieni soddisfatto della tipologia di giochi che state sviluppando, o ti sarebbe piaciuto poter lavorare su un altro genere?
Mi spiego meglio, io non conosco una riga di codice una: se avessi avuto la fortuna di esser stato scelto a programmare per la Lionhead penso starei ancora camminando a 7 metri da terra, ma ciò non toglie che a me piaciono altri generi ludici. Non vado pazzo per i "God-game", ma adoro le avventure grafiche, i first-person-shooter o i racing-game.
Insomma, stai programmando per un gioco, anche se bellissimo nel suo genere, che non ti piace, oppure sei riuscito proprio a far convivere ogni aspetto delle tue passioni ludiche con il lavoro?
Scusa ancora l'OT e magari la sfacciataggine della domanda.
Ciao.

xpiuma

07-11-2003, 09:57

Domanda:

Le schede video attuali (9xxx e fx 5xxx) hanno quantitativi di memoria variabile da 64 a 256mb; secondo te 256mb servono a qualcosa?
Sicuramente per i giochi attuali 128mb sono più che sufficienti, ma poi?

ah, questa te la devo mettere...

http://fun.supereva.it/pellox/Faccine/lore.gif

fek

07-11-2003, 10:42

Originariamente inviato da Custode
Insomma, stai programmando per un gioco, anche se bellissimo nel suo genere, che non ti piace, oppure sei riuscito proprio a far convivere ogni aspetto delle tue passioni ludiche con il lavoro?
Scusa ancora l'OT e magari la sfacciataggine della domanda.
Ciao.

Il mio gioco preferito di sempre e' Populous II, un God Game :D

fek

07-11-2003, 10:43

Originariamente inviato da Mecoita
Fek : da notizie girate in rete sembra che nV abbia aumentato parecchio l'efficenza nell'utilizzo della banda passante sull'nv40 rispetto le precedenti generazioni di chip. Sai qualcosa di più al riguardo ?

Boh, non saprei, detto cosi' e' molto generale. Usano un algoritmo migliorato per lo zbuffer, accorgimenti per le cache e altra roba che, per la verita', a noi non interessa molto.

Originariamente inviato da xpiuma
Domanda:

Le schede video attuali (9xxx e fx 5xxx) hanno quantitativi di memoria variabile da 64 a 256mb; secondo te 256mb servono a qualcosa?
Sicuramente per i giochi attuali 128mb sono più che sufficienti, ma poi?

Per il futuro serviranno eccome! Spero me ne diano 512 presto.

Custode

07-11-2003, 10:44

Grazie per la risposta:)
Ciao.

yossarian

07-11-2003, 11:28

Originariamente inviato da fek
Boh, non saprei, detto cosi' e' molto generale. Usano un algoritmo migliorato per lo zbuffer, accorgimenti per le cache e altra roba che, per la verita', a noi non interessa molto.

utilizzano uno z-test simile a quello di ATi, adottato sull'R300, di tipo a più livelli, con l'ultimo dei quali, se necessario, effettuato alla display resolution (analogamente a quanto fa il Kyro2)

-=Krynn=-

07-11-2003, 12:45

Originariamente inviato da fek

Per il futuro serviranno eccome! Spero me ne diano 512 presto.

quindi te dici che fin da ora conviene cominciare ad equipaggiarsi con 256 ram a bordo delle schede?

yossarian

07-11-2003, 13:05

Originariamente inviato da -=Krynn=-
quindi te dici che fin da ora conviene cominciare ad equipaggiarsi con 256 ram a bordo delle schede?

è già da un po' che circolano test in cui si vede che, soprattutto alle risoluzioni più alte o attivando i filtri, con i titoli più recenti, i 256 Mb danno dei vantaggi. Tieni presente che il frame buffer è molto importante non solo per caricare parte dei dati da elaborare o quelli relativi al front buffer o al back buffer, ma, spesso, è utilizzato anche per caricare dati intermedi di elaborazioni che non è possibile immagazzinare on chip (per evidenti ragioni di spazio). Nel frame buffer sono caricati il texture buffer ed il pixel buffer (il cui spazio occupato dipende proporzionalemte dall'aumento delle dimensioni delle texture e della risoluzione adottata). Questo solo per citare alcuni degli utilizzi tipici della ram video.

Custode

07-11-2003, 13:10

Bè, io la vedo così:
da una parte abbiamo il programmatore geniale che vorrebbe sempre più risorse per poter rendere realtà le sue idee più visionarie, dall'altra abbiamo il videogiocatore che vuole sì rimanere sempre più a bocca aperta, ma nemmeno svenarsi in continuazione:)

Io ho notato questo: da un annetto a questa parte il mondo delle schede video e delle CPU si è in parte assestato, rallentando quella continua corsa all'ultimo Mhz, ed anche le schede video, che ormai escono a cadenza di quattro mesi circa, non sono altro che una leggero overclock della versione precedente.

Risultato?
Bè, io ho comprato la 4200 circa un anno e mezzo e montata sulla mia attuale config: bè, ho passato circa 2 mesi a rodermi il fegato perchè mi sembrava avessi fatto un acquisto inutile. Con i giochi di allora, le differenze tra la precedente GF2 GTS erano minime prestazionalmente, e nulle visivamente. I mesi passano, il mercato rallenta la sua corsa, ed eccoci ad oggi, dove giochi graficamente impressionanti rispetto a quelli di un anno e mezzo fa, girano alla perfezione sulla mio attuale sistema.
Perchè questo? Perchè la corsa all'upgrade continuo ha subito una frenata, dando occasione a chi i giochi li programma di poter migliorare ed affinare il codice su un installato mediamente simile a quello di un anno prima. Nella fascia media, non ci sono state rivoluzioni, anzi: le 5600 e le 9600 offrono prestazioni simili ad una buona 4200, quando non si attivano i filtri (addirittura le versioni lisce di tali schede vanno peggio delle 4200), e questo ha contribuito ad un livellamento generale delle prestazioni.
Ed io ne sono contento perchè per la prima volta in vita mia riesco a giocare alla perfezione con un sistema nel complesso vecchio di più di un anno e mezzo con giochi visivamente sempre più straordinari:)
Quindi, fek, non volermene, ma spero che il trend continui ancora per un pò:)
Ciao.

Crisidelm

07-11-2003, 13:32

Che tu sappia l'Nv40 integrerà un PPP?

-=Krynn=-

07-11-2003, 13:46

Custode, stiamo vivendo in minima parte il fenomeno che avviene sulel console e che permette loro di restare competitive con i titoli da pc, pur avendo hardware vecchiotto....

Tornando al discorso della ram, sarebbe bello se le versioni da 256 andassero al limite pari rispetto a quele da 128, ma non si capisce come mai i produttori abbassino il clock di core/memoria.

Tanto questa attuale generazioe di schede la salto, la mia 8500 è ancora + che degna a far girare i giochi.

Custode

07-11-2003, 14:18

Per Krynn:

sì, è vero, il fenomeno è molto simile, non si può dilatare all'infinito, il progresso deve andare avanti, ma un buono stallo di circa 2 anni a sistema ci sta anche bene ogni tanto:)

Per il discorso ram, i rivenditori abbassano le frequenze della versione a 256 mega per contenere i costi aggiuntivi della memoria in eccesso, almeno finchè questa non cala di prezzo.
Voglio dire, 128 mega di ram performante hanno un costo, 256 ne hanno il doppio: così loro utilizzano ram meno performante e quindi meno costosa per la versione a 256 mega, mantenendo simile il prezzo delle 2 versioni e potendosi così permettere anche un leggero margine di guadagno aggiuntivo.
Il discorso non vale più per schede video high-end: chi può spendere 500Euro per una scheda video, ne può spendere anche 600 per avere il doppio di memoria alla stessa frequenza.
Ciao.

Vifani

07-11-2003, 16:39

Devo ammettere che è molto bello vedere tutte queste persone competenti in questo forum :)

Chissà se in NV40 nVidia farà uso delle tecnologie ereditate all'epoca da Gigapixel 3D per realizzare un'architettura innanzitutto efficiente e non improntata semplicemente sull'estremizzazione dei processi produttivi e sull'aumento delle frequenze di clock. Fossi in loro eviterei il più possibile di diventare dipendenti dalle capacità produttive di TSMC (e IBM).

Riguardo l'architettura, l'uso di una 12x1 penso che sia abbastanza comprensibile. Già nell'attuale generazione di schede video si è visto che l'importanza di effettuare più operazioni in una passata di rendering è superiore rispetto a poterle fare in un minor numero di cicli di clock.

Fossi in loro mi dedicherei ad estremizzare questa tendenza implementando un notevole quantitativo di registri interni e/o buffer ed evitando di intasare la banda passante verso il frame buffer. Contrariamente a quanto si possa pensare, le tecniche di compressione del colore e dello z-buffer sono un provvedimento che riduce ma non elimina il sempre presente problema del collo di bottiglia della banda passante, specie nel rendering con antialiasing.

CS25

07-11-2003, 17:03

E' anche bello rileggerti da queste parti Vifani ;)

yossarian

07-11-2003, 17:08

Originariamente inviato da CS25
E' anche bello rileggerti da queste parti Vifani ;)

mi associo ai saluti di CS

Ciao Vifani

:)

Vifani

07-11-2003, 17:29

Salve ragazzi.

In realtà non me ne sono mai andato....... ho sempre seguito tutte le discussioni di questo forum (carina anche la discussione "4x2 = 8x1?").

Ultimamente mi sto dedicando alla programmazione di un motore grafico OpenGL. Devo dire che con i Vertex ed i Pixel Shader ci si diverte un mondo.... si possono fare cose fantastiche sfruttando le unità di calcolo della GPU. In questo momento sto lavorando ad un sistema di illuminazione basato sulle Stencil Shadow e sul Carmak's Reverse.....

Per questo motivo mi sto interessando della piega che stanno prendendo i produttori di chip grafici: ho bisogno di sapere in che direzione sviluppare il mio progettino ;)

P.S. CS25 ci vediamo in IRC uno di questi giorni così ci facciamo un po di seghe mentali sulle future schede video :D

Crisidelm

07-11-2003, 17:33

Beh, le DX neXt o DX10 che dir si voglia, dovrebbero comprendere anche i Programmable Primitive Processor...tanto per dirne una. Per le Dx 9.1 ho letto in giro che il FP dovrebbe essere richiesto a 24, ma bisogna aspettare per vedere se sarà così...

yossarian

07-11-2003, 17:40

Originariamente inviato da Crisidelm
Beh, le DX neXt o DX10 che dir si voglia, dovrebbero comprendere anche i Programmable Primitive Processor...tanto per dirne una. Per le Dx 9.1 ho letto in giro che il FP dovrebbe essere richiesto a 24, ma bisogna aspettare per vedere se sarà così...

è ancora presto per parlare di specifiche DX10 (non si troverà ancora niente su questa generazione di HW). In teoria, anche per le DX9 era prevista la possibilità di utilizzo di PPP; però si tratta di un tipo di tecnologia ancora poco sfruttabile e, di conseguenza, poco conveniente.
Per l'FP24, questo, per i dati in input delle textures, era già previsto dalle DX9, di cui queste sono alcune specifiche:

PS2.0 registers
- colour = 8-bit integer only
- constant float = minimum 16-bit FP but this limits the actual number of constants that can be used
- input texture coordinate = minimum 24-bit FP, preferred 32-bit FP, 16-bit FP partial precision for dependent reads
- sampler = minimum 16-bit FP to support 16-bit texture formats
- temporary = minimum 16-bit to support anything taken from a 16-bit FP source

Crisidelm

07-11-2003, 17:46

Uh-uh

yossarian

07-11-2003, 18:01

Originariamente inviato da Crisidelm
Uh-uh

:confused:

Crisidelm

07-11-2003, 18:06

Niente, riflettevo...fra le altre altre se non sbaglio fra le feature iniziali dell'NV3x c'era anche un PPP, l'idea però è stata poi abbandonata...

CS25

07-11-2003, 18:13

Originariamente inviato da Vifani
P.S. CS25 ci vediamo in IRC uno di questi giorni così ci facciamo un po di seghe mentali sulle future schede video :D

Volentieri, anche se ultimamente sono poco presente... facciamo prima a decidere un giorno :)

yossarian

07-11-2003, 18:24

Originariamente inviato da Crisidelm
Niente, riflettevo...fra le altre altre se non sbaglio fra le feature iniziali dell'NV3x c'era anche un PPP, l'idea però è stata poi abbandonata...

se ne era parlato relativamente al supporto possibile dell'NV30 al displacement mapping (si era parlato di un array di unità di calcolo indipendenti tipo VP10, al posto dei VS tradizionali, che avrebbero potuto supplire alla mancanza di un supporto HW a tale feature). In realtà, nVIDIA non si è mai pronunvìciata per confermare o confutare l'ipotesi dell'array di processori; da valutazioni effettuate, basate anche sui dati dei bench, sembra abbastanza evidente che l'architettura sia di tipo tradizionale. Questo anche alla luce del fatto che un'architettura di tipo PPP è supportata solo da alcuni SW di grafica pro (per cui, se ha senso su chip impiegati per grafica 3D o per la creazione di immagini fotorealistiche o effetti cinematografici, che fanno uso anche di textures procedurali e per cui esiste il supporto SW e gli fps contano in maniera relativa, diverso è il discorso per prodotti orientati al mercato videoludico.

fek

07-11-2003, 18:41

Originariamente inviato da -=Krynn=-
quindi te dici che fin da ora conviene cominciare ad equipaggiarsi con 256 ram a bordo delle schede?

Si' :D

yossarian

07-11-2003, 18:44

Originariamente inviato da fek
Si' :D

'sti sviluppatori di SW non si accontentano mai

:D :D

Vifani

07-11-2003, 19:02

Originariamente inviato da yossarian
'sti sviluppatori di SW non si accontentano mai

:D :D

Per forza... nVidia stessa gli ha detto di usare più poligoni così loro fanno un gioco più pesante e poi i videogiocatori devono comprare NV40 per poterci giocare decentemente... è tutto un mangia mangia ;)

fek

07-11-2003, 19:08

Originariamente inviato da Vifani
Per questo motivo mi sto interessando della piega che stanno prendendo i produttori di chip grafici: ho bisogno di sapere in che direzione sviluppare il mio progettino ;)

Molla le stencil shadow e passa allo shadow buffer ;)

Originariamente inviato da yossarian
è ancora presto per parlare di specifiche DX10 (non si troverà ancora niente su questa generazione di HW). In teoria, anche per le DX9 era prevista la possibilità di utilizzo di PPP; però si tratta di un tipo di tecnologia ancora poco sfruttabile e, di conseguenza, poco conveniente.

Da quello che mi e' capitato di sentire in giro (sono solo rumor quindi), con le DX10 sara' possibile create vertici all'interno della GPU (quindi un PPP). Non prima del 2005/2006 quindi.

yossarian

07-11-2003, 19:24

Originariamente inviato da fek

Da quello che mi e' capitato di sentire in giro (sono solo rumor quindi), con le DX10 sara' possibile create vertici all'interno della GPU (quindi un PPP). Non prima del 2005/2006 quindi.

infatti è a questo che mi riferivo; l'utilizzo di PPP prevede modifiche non da poco all'architettura delle pipelines e ci si arriverà solo per gradi; con l'utilizzo di PPP per le unità VS e PS, sarà possibile non solo creare vertici ma anche textures all'interno della GPU (qualora la stessa architettura fosse utilizzata anche per le pipelines di rendering).
A quel punto, mi sa tanto che voi sviluppatori potreste veramente scatenarvi (non oso pensare a quello che potreste combinare :eek: )

;)

Vifani

07-11-2003, 20:50

Originariamente inviato da fek
Molla le stencil shadow e passa allo shadow buffer ;)

Non vorrei andare OT, magari possiamo parlarne privatamente o aprire un altro topic sull'argomento. Ti spiego solo come la penso sull'argomento.

Le tecniche di Shadow Mapping, attualmente le più usate nei videogames, danno risultati molto lontani dal fotorealismo. Il loro limite è essere legati alla risoluzione massima delle texture. Il risultato sono delle ombre pixellose. A volte filtrandole in bilineare danno quasi l'effetto della penombra..... ma è qualcosa di estremamente approssimativo. Le Infinite Volume Shadow (o Stencil Shadow) non hanno questo problema. E' pur vero che ne ha molti altri, ma usando i vertex shader per proiettare la geometria i risultati sono molto soddisfacienti ed il dettaglio dell'ombra è il meglio che sia possibile ottenere. Più difficile è generare la penombra ma.... usando l'Ultra Shadow di nVidia (non lo so esattamente come funziona perché non ho provato) dovrebbe essere possibile aumentare il numero di ombre proiettate per oggetto e realizzare anche la penombra senza far crollare troppo le prestazioni.

Tanto per non andare OT: la possibilità di far generare alla GPU i vertici mi avrebbe semplificato non poco la vita proprio nella generazione delle stencil shadow tramite Vertex Shader. Comunque il problema ormai l'ho risolto ;)

-=Krynn=-

07-11-2003, 21:33

Originariamente inviato da Vifani
Per forza... nVidia stessa gli ha detto di usare più poligoni così loro fanno un gioco più pesante e poi i videogiocatori devono comprare NV40 per poterci giocare decentemente... è tutto un mangia mangia ;)

lol, è vero:sofico:

checo

07-11-2003, 22:24

Originariamente inviato da Vifani
Non vorrei andare OT, magari possiamo parlarne privatamente o aprire un altro topic sull'argomento. Ti spiego solo come la penso sull'argomento.

aprite un topic, con magari qualche esempio, link guida per provare

fek

08-11-2003, 12:58

Originariamente inviato da Vifani
Non vorrei andare OT, magari possiamo parlarne privatamente o aprire un altro topic sull'argomento. Ti spiego solo come la penso sull'argomento.

Passa allo shadow mapping. Punto :)