Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Schede Video > Schede Video - Discussioni generali

HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione
HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione
HONOR ha finalmente lanciato il suo nuovo flagship: Magic 8 Pro. Lo abbiamo provato a fondo in queste settimane e ve lo raccontiamo nella nostra recensione completa. HONOR rimane fedele alle linee della versione precedente, aggiungendo però un nuovo tasto dedicato all'AI. Ma è al suo interno che c'è la vera rivoluzione grazie al nuovo Snapdragon 8 Elite Gen 5 e alla nuova MagicOS 10
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata
Le webcam Insta360 Link 2 Pro e Link 2C Pro sono una proposta di fascia alta per chi cerca qualità 4K e tracciamento automatico del soggetto senza ricorrere a configurazioni complesse. Entrambi i modelli condividono sensore, ottiche e funzionalità audio avanzate, differenziandosi per il sistema di tracciamento: gimbal a due assi sul modello Link 2 Pro, soluzione digitale sul 2C Pro
Motorola edge 70: lo smartphone ultrasottile che non rinuncia a batteria e concretezza
Motorola edge 70: lo smartphone ultrasottile che non rinuncia a batteria e concretezza
Motorola edge 70 porta il concetto di smartphone ultrasottile su un terreno più concreto e accessibile: abbina uno spessore sotto i 6 mm a una batteria di capacità relativamente elevata, un display pOLED da 6,7 pollici e un comparto fotografico triplo da 50 MP. Non punta ai record di potenza, ma si configura come alternativa più pragmatica rispetto ai modelli sottili più costosi di Samsung e Apple
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 09-03-2010, 13:11   #21801
Alekos Panagulis
Senior Member
 
L'Avatar di Alekos Panagulis
 
Iscritto dal: Jan 2010
Città: Phanteks P600s white - Gigabyte x670e Aorus Master - Ryzen 7800x3D cooled by Corsair H115i pro - 64GB DDR5 Corsair vengeance pro@6000mhz - Gigabyte 5090 Aorus Ice - Corsair hx1200i - Gaming on LG 55" CX Gsync + DELL Alienware QD-OLED AW3423DW
Messaggi: 13105
Spiegazione magnifica
Chiara e semplice.
__________________
GALLERY - Phanteks P600s white - Gigabyte x670e Aorus Master - Ryzen 9800x3D cooled by Corsair H115i pro - 64GB DDR5 Corsair vengeance pro@6000mhz - Gigabyte 5090 Aorus Master Ice - WD Black SN850X 4TB - Corsair hx1200i ||Gaming on LG 55" CX Gsync + DELL Alienware QD-OLED AW3423DW
Lenovo Legion 14" slim rtx 4060 powered
Alekos Panagulis è offline  
Old 09-03-2010, 13:14   #21802
Maury
Senior Member
 
L'Avatar di Maury
 
Iscritto dal: Feb 2000
Messaggi: 11186
Ma secondo voi come mai Ati non ha reclamato per via delle versioni non equivalenti di unigine usate da nVidia ? Forse sa già che alla prova dei fatti, che avverrà presumibilmente tra poco, tutto il castello cadrà miseramente ?
__________________
PC 1 : |NZXT 510i|MSI PRO Z690 A|I5 [email protected] Ghz (Pcore) 4.5 Ghz (Ecore)|AIO ENDORFY NAVI F280|32 GB BALLISTIX 3600 cl 14 g1|GIGABYTE 4070 SUPER AERO OC|RM850X|850 EVO 250|860 EVO 1TB|NVMe XPG-1TB||LG OLED C1 - 55 |

PC 2 : |Itek Vertibra Q210|MSI PRO B660M-A|I5 12500|32 GB KINGSTON RENEGADE 3600|ARC A770 LE 16 Gb|MWE 750w|

ARC 770 LE 16 Gb Vs RTX 3070 - CLICCA QUI
Maury è offline  
Old 09-03-2010, 13:20   #21803
calabar
Senior Member
 
L'Avatar di calabar
 
Iscritto dal: Oct 2001
Messaggi: 14739
Immagino che Nvidia, scegliendo una soluzione più dinamica, abbia anche fatto i propri calcoli, magari scommettendo un po' sul futuro.
Un po' come aveva fatto ATI con R600 e l'AA via shader, scommessa che per ati si è rivelata poi fallimentare e corretta in seguito.

Cosa sarà di questa invece lo sapremo tra qualche tempo.
Secondo me, visti i supposti consumi di Fermi, questo tipo di vantaggio dovrà mostrarsi in fretta, perchè se lo facesse quando sarà disponibile una generazione più aggiornata di schede, allora chi si terrebbe una scheda che si ha ancora prestazioni decenti, ma consumi indecenti, per godersi questo vantaggio?

A mio parere comunque, se il "potenziamento" del tessellator nvidia (che poi da quel che avevo capito non era il tessellator ad essere stato potenziato, ma gli stadi successivi che dovevano gestire il gran numero di triangoli generati dal tessellator) porterà dei vantaggi con i giochi futuri, questo accadrà quando i motori di tali giochi saranno programmati per schede con il tessellator, ossia con geometrie leggerissime arricchite poi dal tessellator, così come accade per l'Ungine bench.
E questo secondo me non si vedrà ancora per parecchi anni, ossia fino a quando ci sarà la necessità di creare una geometria di base molto fitta per poter girare su schede senza tessellator.

@skizzo99999999
Un appunto sul tuo discorso (ne riprendo i numeri):
Nel caso della GPU con l'hardware dedicato (quindi 480SP + tessellazione completa) e della GPU flessibile (512SP con parte del tessellator via shader) si rischia di farsi ingannare dai numeri.
Di fatto cioè la scheda con da 512 sarà paragonabile ad una scheda da 480+hw come prestazioni (posto che le due soluzioni possano un minimo equivalersi, sempre per ipotesi), il che significa che a parità di sp andrà di meno.
Quindi se una scheda con 512 SP può far gridare all'estrema potenza, dobbiamo ricordare che di fatto con tessellation questa scheda è come se fosse una 480 SP, e non dobbiamo stupirci se non raggiunge i risultati che ci aspettereno da un "full 512 SP".
Forse il discorso è un po' contorto, ma spero di essermi fatto capire!
calabar è offline  
Old 09-03-2010, 13:24   #21804
yossarian
Senior Member
 
Iscritto dal: Mar 2001
Messaggi: 5390
Quote:
Originariamente inviato da calabar Guarda i messaggi
Immagino che Nvidia, scegliendo una soluzione più dinamica, abbia anche fatto i propri calcoli, magari scommettendo un po' sul futuro.
Un po' come aveva fatto ATI con R600 e l'AA via shader, scommessa che per ati si è rivelata poi fallimentare e corretta in seguito.

Cosa sarà di questa invece lo sapremo tra qualche tempo.
Secondo me, visti i supposti consumi di Fermi, questo tipo di vantaggio dovrà mostrarsi in fretta, perchè se lo facesse quando sarà disponibile una generazione più aggiornata di schede, allora chi si terrebbe una scheda che si ha ancora prestazioni decenti, ma consumi indecenti, per godersi questo vantaggio?

A mio parere comunque, se il "potenziamento" del tessellator nvidia (che poi da quel che avevo capito non era il tessellator ad essere stato potenziato, ma gli stadi successivi che dovevano gestire il gran numero di triangoli generati dal tessellator) porterà dei vantaggi con i giochi futuri, questo accadrà quando i motori di tali giochi saranno programmati per schede con il tessellator, ossia con geometrie leggerissime arricchite poi dal tessellator, così come accade per l'Ungine bench.
E questo secondo me non si vedrà ancora per parecchi anni, ossia fino a quando ci sarà la necessità di creare una geometria di base molto fitta per poter girare su schede senza tessellator.

@skizzo99999999
Un appunto sul tuo discorso (ne riprendo i numeri):
Nel caso della GPU con l'hardware dedicato (quindi 480SP + tessellazione completa) e della GPU flessibile (512SP con parte del tessellator via shader) si rischia di farsi ingannare dai numeri.
Di fatto cioè la scheda con da 512 sarà paragonabile ad una scheda da 480+hw come prestazioni (posto che le due soluzioni possano un minimo equivalersi, sempre per ipotesi), il che significa che a parità di sp andrà di meno.
Quindi se una scheda con 512 SP può far gridare all'estrema potenza, dobbiamo ricordare che di fatto con tessellation questa scheda è come se fosse una 480 SP, e non dobbiamo stupirci se non raggiunge i risultati che ci aspettereno da un "full 512 SP".
Forse il discorso è un po' contorto, ma spero di essermi fatto capire!
diciamo che non ha senso considerare un'architettura da 512 alu alla stregua di una di tipo 480+unità dedicate (mi tengo l'architettura 480+T che è molto più veloce anche nel'esecuzione di T). Il vantaggio di un'architettura con alu generiche è che posso bilanciare meglio i carichi di lavoro in base alle necessità e questo significa che quando mi servirà più tessellation non avrò una 480+T (tessellator) ma, magari, una 320+T, il che significa che T sarà eseguita molto più velocemente ma tutto il resto subirà notevoli rallentamenti, senza ocntare che un massiccio utilizzo di tessellation richede anche un maggior impegno dei PS

Ultima modifica di yossarian : 09-03-2010 alle 13:30.
yossarian è offline  
Old 09-03-2010, 13:26   #21805
Foglia Morta
Senior Member
 
L'Avatar di Foglia Morta
 
Iscritto dal: Jul 2005
Messaggi: 7819
Quote:
Originariamente inviato da calabar Guarda i messaggi
Immagino che Nvidia, scegliendo una soluzione più dinamica, abbia anche fatto i propri calcoli, magari scommettendo un po' sul futuro.
Un po' come aveva fatto ATI con R600 e l'AA via shader, scommessa che per ati si è rivelata poi fallimentare e corretta in seguito.
se non sbaglio l' approccio di Fermi è simile a quello di RV770 ( che può fare hull e domain tramite VS e GS ) mentre con RV870 ATi ha scelto circuiteria dedicata , quindi al limite direi scelte diverse e stop
__________________
Sample is selezionated !
Foglia Morta è offline  
Old 09-03-2010, 13:57   #21806
Andrea deluxe
Bannato
 
L'Avatar di Andrea deluxe
 
Iscritto dal: Jan 2006
Città: Red Light District
Messaggi: 13937
scusate, ma non resisto....

http://www.youtube.com/watch?v=gNIPc...eature=related
Andrea deluxe è offline  
Old 09-03-2010, 13:59   #21807
Maury
Senior Member
 
L'Avatar di Maury
 
Iscritto dal: Feb 2000
Messaggi: 11186
Quote:
Originariamente inviato da Ratatosk Guarda i messaggi
I nodi vengono al pettine da soli nelle recensioni, perché scoprirsi prima?
E' quello che penso io

Del resto ATI è troppo tranquilla in questo periodo, va bene che non ha mai fatto chissà che proclami o attacchi mediatici alla concorrenza, ma a questo giro è davvero mansueta nel proporsi (o meglio nel non proporsi)...

Qua gatta ci cova ...
__________________
PC 1 : |NZXT 510i|MSI PRO Z690 A|I5 [email protected] Ghz (Pcore) 4.5 Ghz (Ecore)|AIO ENDORFY NAVI F280|32 GB BALLISTIX 3600 cl 14 g1|GIGABYTE 4070 SUPER AERO OC|RM850X|850 EVO 250|860 EVO 1TB|NVMe XPG-1TB||LG OLED C1 - 55 |

PC 2 : |Itek Vertibra Q210|MSI PRO B660M-A|I5 12500|32 GB KINGSTON RENEGADE 3600|ARC A770 LE 16 Gb|MWE 750w|

ARC 770 LE 16 Gb Vs RTX 3070 - CLICCA QUI
Maury è offline  
Old 09-03-2010, 14:01   #21808
Andrea deluxe
Bannato
 
L'Avatar di Andrea deluxe
 
Iscritto dal: Jan 2006
Città: Red Light District
Messaggi: 13937
Quote:
Originariamente inviato da Maury Guarda i messaggi
E' quello che penso io

Del resto ATI è troppo tranquilla in questo periodo, va bene che non ha mai fatto chissà che proclami o attacchi mediatici alla concorrenza, ma a questo giro è davvero mansueta nel proporsi (o meglio nel non proporsi)...

Qua gatta ci cova ...
http://www.thinq.co.uk/news/2010/3/8...-for-the-cash/
Andrea deluxe è offline  
Old 09-03-2010, 14:05   #21809
Diobrando_21
Senior Member
 
L'Avatar di Diobrando_21
 
Iscritto dal: Apr 2008
Messaggi: 3103
Scusate è vero che in fermi nell'uso massivo di tessellazione verrano sottratte risorse x il rendering, tuttavia non vedo il problema...se ho ben capito (anche in base a discorsi precedentemente fatti) lo scopo è proprio quello di creare modelli poligonali di partenza più semplici (quindi diminuirà la RICHIESTA di risorse x il rendering) per poi arricchirli con un uso intensivo di tessellazione (quindi è giusto dedicare la maggior parte delle risorse a questa funzione)...mentre fermi potrà farlo senza problemi, le ati no, perdendo colpi nell'uso intensivo di tessellazione (visto che ad un certo punto le risorse del tessellatore ati finiscono senza possibilità di incrementarle, tra l'altro già perdono colpi adesso che la tessellazione è minima)...quindi a me sembra più che altro che fermi dia uno sguardo al futuro su l'uso che effettivamente se ne dovrà fare della tessellazione mentre le ati siano più adatte all'uso attuale...questo è quello che ho capito, spero di avere qualche delucidazione, grazie...
__________________
Case: Stacker 830 nVidia Edition-Ali: Corsair HX1000W-Mobo: Asus R2E-CPU: i7 920 3,80 Ghz-Dissi: NH-U12P SE-Ram: Dominator 6GB 1600Mhz CAS8-VGA: Zotac GTX480 2-Way SLI-HDD: 2x150GB Raptor Raid0;1TB WD10EADS-Schermo: Acer GD245HQ+nVidia 3D Vision-SO: Win8 Pro x64-Mouse: Razer Mamba-Cuffie: Sharkoon X-Tatic 5.1 Digital-Gaming: G13-G25-Rumble Pad 2, Xbox360 controller

Ultima modifica di Diobrando_21 : 09-03-2010 alle 14:09.
Diobrando_21 è offline  
Old 09-03-2010, 14:10   #21810
appleroof
Senior Member
 
L'Avatar di appleroof
 
Iscritto dal: Oct 2005
Messaggi: 38298
Quote:
Originariamente inviato da yossarian Guarda i messaggi
sono sempre stato un convinto fautore dei bench sintetici ma solo se questi sono eseguiti a parità di condizioni. NOn posso far girare il 3dmark 2001 su una vga e il 3dmark2003 su un'altra e trarre conclusioni in merito sulle prestazioni relative

cut
non capisco, intenderesti che unigine è sbilanciato verso Nvidia?

Quote:
Originariamente inviato da Ratatosk Guarda i messaggi
Ti da un'idea più affidabile vedere bench di Call of Prypat, DiRT2 e AvP, per capire come vanno e andranno i giochi DX11 che non Unigine. Questo esattamente come accade per 3DMark Vantage che è molto meno affidabile di un qualunque gioco DX10 per capire come vanno i giochi DX10.
cut
ma i post li leggete?? dicevo che unigine è un test sintetico e vale per quello che è, ciò non toglie che come al solito occorre anche testare i giochi (e quanti più possibili) per capire in media come va una vga
__________________
Corsair 5000D - Ryzen 7 7700 - Asrock B650E PG - 2x16gb G.Skill Trident Z5 ddr5 6000 mhz - GeForce Rtx 4070Ti S. - Samsung 980 pro 1tb + Crucial mx500 1tb + WD 1tb - Corsair rm850w - LG oled C4 48
le vga che ho avuto
appleroof è offline  
Old 09-03-2010, 14:20   #21811
Andrea deluxe
Bannato
 
L'Avatar di Andrea deluxe
 
Iscritto dal: Jan 2006
Città: Red Light District
Messaggi: 13937
Quote:
Originariamente inviato da Diobrando_21 Guarda i messaggi
Scusate è vero che in fermi nell'uso massivo di tessellazione verrano sottratte risorse x il rendering, tuttavia non vedo il problema...se ho ben capito (anche in base a discorsi precedentemente fatti) lo scopo è proprio quello di creare modelli poligonali di partenza più semplici (quindi diminuirà la RICHIESTA di risorse x il rendering) per poi arricchirli con un uso intensivo di tessellazione (quindi è giusto dedicare la maggior parte delle risorse a questa funzione)...mentre fermi potrà farlo senza problemi, le ati no, perdendo colpi nell'uso intensivo di tessellazione (visto che ad un certo punto le risorse del tessellatore ati finiscono senza possibilità di incrementarle, tra l'altro già perdono colpi adesso che la tessellazione è minima)...quindi a me sembra più che altro che fermi dia uno sguardo al futuro su l'uso che effettivamente se ne dovrà fare della tessellazione mentre le ati siano più adatte all'uso attuale...questo è quello che ho capito, spero di avere qualche delucidazione, grazie...
metti caso che hai fermi con 512sp.

stai eseguendo una scena senza tassellazione e sei a 300fps....

ad un certo punto della scena compaiono degli oggetti che necessitano di tassellazione.

a questo punto il driver deve associare il compito agli shader che hanno una funzione fissa di tassellazione con priorita' rispetto agli altri effetti.

da 300fps al secondo ne avrai molti meno, perche' quegli shader che stanno calcolando la tassellazione, non possono calcolare il resto allo stesso momento.

poi sara' comunque il driver a stabilire quanti shader impegnare allo stesso momento per la tassellazione e gli halt per le altre istruzioni.
tutto questo facendo attenzione a non creare colli di bottiglia per il resto delle istruzioni...

Ultima modifica di Andrea deluxe : 09-03-2010 alle 14:22.
Andrea deluxe è offline  
Old 09-03-2010, 14:27   #21812
yossarian
Senior Member
 
Iscritto dal: Mar 2001
Messaggi: 5390
Quote:
Originariamente inviato da appleroof Guarda i messaggi
non capisco, intenderesti che unigine è sbilanciato verso Nvidia?
nVidia ha usato una versione differente, la 1.1, che permette un incremento prestazionale del 30% in quanto riduce l'overdraw dovuto alle superfici nascoste grazie ad un uso più aggressivo delle operazioni di culling. Questo incremento, su un'architettura come quella di fermi che si giova in misuta maggiore, della riduzione di tale overdraw perchè scarica gran parte del lavoro delle unità di shading e ha più risorse da dedicate alla tessellation, può avere anche valori superiori al 30%

Ultima modifica di yossarian : 09-03-2010 alle 14:52.
yossarian è offline  
Old 09-03-2010, 14:53   #21813
skizzo99999999
Member
 
Iscritto dal: Oct 2006
Messaggi: 102
Quote:
Originariamente inviato da calabar Guarda i messaggi
@skizzo99999999
Un appunto sul tuo discorso (ne riprendo i numeri):
Nel caso della GPU con l'hardware dedicato (quindi 480SP + tessellazione completa) e della GPU flessibile (512SP con parte del tessellator via shader) si rischia di farsi ingannare dai numeri.
Di fatto cioè la scheda con da 512 sarà paragonabile ad una scheda da 480+hw come prestazioni (posto che le due soluzioni possano un minimo equivalersi, sempre per ipotesi), il che significa che a parità di sp andrà di meno.
Quindi se una scheda con 512 SP può far gridare all'estrema potenza, dobbiamo ricordare che di fatto con tessellation questa scheda è come se fosse una 480 SP, e non dobbiamo stupirci se non raggiunge i risultati che ci aspettereno da un "full 512 SP".
Forse il discorso è un po' contorto, ma spero di essermi fatto capire!
Ribadisco che i numeri che ho dato sono campati in aria e servono solo come esempi, ma ciò non toglie che secondo me parlare con un po di numeri aiuta. Ribadisco che quello che conta è quanto ci metto ad elaborare un frame completo di tutto: tutti i vertex, tutti i pixel, tutta la tessellazione, ecc... Mettiamo caso che un frame impieghi 16 millisedondi per essere eseguito sulla gpu1 con 480+T. In quei 16 msec, diciamo che la tessellazione ci mette 2 millisecondi. quindi per quei 2 millisendi io ho 480 sp occupati (facciamo finta che si abbia un utilizzo del 100% tanto per semplificare) più gli sp per hull e domain, mentre per i restanti 14 msec saranno occupati "soltanto" i 480 sp generici, con quelli per hull e domain a girarsi i pollici. Nella gpu2 a 512 sp, mettiamo (sempre per semplificare) di dedicare 32 sp alla tessellazione, quindi di rimanere con 480 sp generici per il resto. Quelle operazioni che prima richiedevano 2 msec, grazie alla minor efficienza degli sp generici (ma comunque relativa, visto le considerazione del post precedente) mettiamo che ne richiedono 3. Guardando gli atri 480sp, per quanto riguarda i primi 3 msec la situazione è uguale alla gpu1, presupponendo che si riesca ad occuparli tutti nonostante si abbiano meno dati in "uscita" dalla fase di tessellazione nell'unità di tempo, ma questo non possiamo saperlo (anche se il tessellator potenziato e diviso in 16 parti serve anche per poter offrire, oltre a una potenza totale maggiore anche una migliore granularità utile nel caso in questione). Negli gli altri 13 msec però, io ho a disposizione tutti e 512 gli sp, per cui posso eseguire il resto più velocemente (e quindi impiegare meno di 13 msec). Quindi rallentando una fase ho velocizzato il resto. Il fatto di dedicare 64, 128, 256, sp alla tessellazione invece che 32 non cambia il risultato: infatti gli sp "sottratti" serviranno a terminare prima la tessellazione in modo da liberarli prima per eseguire gli altri compiti, ma il tempo totale non cambia. Può essere utile per bilanciare meglio il carico in modo da tenere sempre più unità utilizzate, visto che le operazioni possono dipendere le une dalle altre ed eseguire massicciamente operazioni prima di un tipo poù essere utile per occupare meglio tutte le risorse a disposizione.
Faccicamo un altro esempio con la gpu2: mettiamo che gli sp eseguano una operazione ogni msec e ci mettano sempre un ciclo per ogni operazione (altra semplificazione, ma come sempre è per far capire): vuol dire che ho a disposizione 512 "cicli" per ogni msec, il che vuol dire 512x16=8192 cicli in totale occupati nel frame. Se io uso 32sp per hull e domai e ho detto che ci metto 3msec, vuol dire che l'operazione consuma 32x3=96 cicli. Me ne rimangono (480x3)+(512x13)=8096 a disposizione per il resto. Se io invece impiego subito 96sp, finisco tutto in 1 msec, per cui ho bruciato più sp subito, ma da'altro canto ci ho sempre messo 96 cicli, per cui ho sempre (416x1)+(512x15)=8096 per il resto. Se gli sp eseguissero invece una operazione più velocemente di un'altra allora il bialnciamento delle unità servirebbe a trovare il "punto" giusto in cui avere le migliori prestazioni, ma non è questo il nocciolo della questione. Il senso dell'esempio è che quello che conta è il tempo totale del frame, non della singola fase.

Come nel mio esempio precedente, è più o meno lo stesso principio del pixel e vertex shader contro shader unificati: questi ultimi, nonostante fossero meno efficienti (= più lenti) hanno permesso di sfruttare al meglio tutte le unità a disposizione in ogni momento, in modo da ganarare l'intero frame più velocemente. Qundi una scheda "full 512sp", cioè 512+T (che presuppone ulteriori sp per hull e domain) sarebbe si più veloce di una "512 senza T", ma sello stesso die size della 512+T magari ci posso mettere una 544 senza T. Il concetto è questo.

Ultima modifica di skizzo99999999 : 09-03-2010 alle 15:00.
skizzo99999999 è offline  
Old 09-03-2010, 14:55   #21814
Diobrando_21
Senior Member
 
L'Avatar di Diobrando_21
 
Iscritto dal: Apr 2008
Messaggi: 3103
Quote:
Originariamente inviato da Andrea deluxe Guarda i messaggi
metti caso che hai fermi con 512sp.

stai eseguendo una scena senza tassellazione e sei a 300fps....

ad un certo punto della scena compaiono degli oggetti che necessitano di tassellazione.

a questo punto il driver deve associare il compito agli shader che hanno una funzione fissa di tassellazione con priorita' rispetto agli altri effetti.

da 300fps al secondo ne avrai molti meno, perche' quegli shader che stanno calcolando la tassellazione, non possono calcolare il resto allo stesso momento.

poi sara' comunque il driver a stabilire quanti shader impegnare allo stesso momento per la tassellazione e gli halt per le altre istruzioni.
tutto questo facendo attenzione a non creare colli di bottiglia per il resto delle istruzioni...
Quote:
Originariamente inviato da Ratatosk Guarda i messaggi
Il problema è che prima arricchisci i modelli poligonali e poi fai rendering su quei poligoni, quindi le richieste di risorse per il rendering on diminuiscono, ma solo il numero di poligoni che la CPU deve dare in pasto alla GPU.



Questo si sapeva anche se non ce lo diceva AMD
ok, ora è tutto più chiaro...grazie.

Però allora fermi avrà problemi x i discorsi suddetti, le ati hanno problemi non appena si attiva un minimo di tessellazione...io sinceramente non ne vedo più l'utilità...in entrambe i casi non vedo risultati che potrebbero soddisfarmi. È ovvio che se avremmo vga che stanno a 300fps senza e 100 con, sarò strafelice ma non credo proprio sia il caso di queste vga...che ne dite?
__________________
Case: Stacker 830 nVidia Edition-Ali: Corsair HX1000W-Mobo: Asus R2E-CPU: i7 920 3,80 Ghz-Dissi: NH-U12P SE-Ram: Dominator 6GB 1600Mhz CAS8-VGA: Zotac GTX480 2-Way SLI-HDD: 2x150GB Raptor Raid0;1TB WD10EADS-Schermo: Acer GD245HQ+nVidia 3D Vision-SO: Win8 Pro x64-Mouse: Razer Mamba-Cuffie: Sharkoon X-Tatic 5.1 Digital-Gaming: G13-G25-Rumble Pad 2, Xbox360 controller
Diobrando_21 è offline  
Old 09-03-2010, 14:57   #21815
PConly92
Senior Member
 
L'Avatar di PConly92
 
Iscritto dal: Nov 2008
Messaggi: 1489
Quote:
Originariamente inviato da appleroof Guarda i messaggi
non è vero, infatti mentre è attiva la tassellazione è attiva anche la "classica" renderizzazione (quest'ultima la puoi escludere ma normalmente il test è fatto "completo")
peccato che nvidia usasse una versione modificata di unigine dove la renderizzazione "classica" è ridotta al minimo...quindi quei frame adesso e come non ci fosserò
__________________
Case: Asus P201 mATX Psu: Nzxt C850w Atx3.1 Cpu: Ryzen 7700x Cooler: Thermalright FP black 360mm Mb: Gigabyte B650m Ds3h Ram: Corsair Vengeance 16x2 6000 cl30 Gpu: Zotac 4070TiS Solid OC 16gb Ssd: Samsung 990pro 1tb
Monitor/Tv: LG OLED 48 A2 2022 Audio: Soundbar HW-Q600B + SWA-9200S 5.1
PConly92 è offline  
Old 09-03-2010, 15:37   #21816
calabar
Senior Member
 
L'Avatar di calabar
 
Iscritto dal: Oct 2001
Messaggi: 14739
Quote:
Originariamente inviato da Ratatosk Guarda i messaggi
Io direi il contrario. Se la tessellation diventerà massiva nell'approccio nVIDIA toglierà risorse al rendering (che non sarà quello di Unigine), in quello AMD no.
Con "scommessa per il futuro" NON intendevo dire che quello sarà il futuro e nvidia scommetterà su di esso, ma semplicemente che nvidia ha scommesso sul fatto che in futuro quelle feature saranno un vantaggio.

Quote:
Originariamente inviato da yossarian Guarda i messaggi
[...] il che significa che T sarà eseguita molto più velocemente ma tutto il resto subirà notevoli rallentamenti, senza ocntare che un massiccio utilizzo di tessellation richede anche un maggior impegno dei PS
Credo che in questo Diobrando_21 abbia ragione: si può supporre che in un motore ben programmato faccia corrispondere alla tessellazione una diminuzione della necessità di potenza per il resto.
Quindi: no tessellation: SP liberi per il resto, tessellation: riversamento della potenza non più necessaria nel rendenring per fare tessellation.
Tutto sommato l'idea sembra buona, bisogna poi vedere i numeri della pratica.

Quote:
Originariamente inviato da skizzo99999999 Guarda i messaggi
[...]
Certo Anche i miei numeri del resto lo erano.

Provo a chiarire quel che volevo dire con un ulteriore esempio, totalmente ipotetico.
Poniamo di avere un'architettura x dx11 con tessellatore dedicato (tutto!) e 240SP. Ora facciamo un'architettura nuova, con 512 sp (più del doppio) e tessellatore solo in parte dedicato (tipo fermi).
Ora, vedendo i 512SP, l'utente si aspetta prestazioni legate ad una potenza più che doppia. Ma in realtà questo non è vero, perchè la mancanza di hd dedicato lo farà andare come una 480 sp (anche stavolta, un numero quasi a caso, tanto per capirci).

Per il resto naturalmente concordo, l'unico dubbio riguarda proprio quei parametri che non conosciamo, ossia quanto un'unità dedicata è più efficiente e quanto spazio occupa rispetto alle SP.

Quote:
Originariamente inviato da calabar Guarda i messaggi
[...] (che poi da quel che avevo capito non era il tessellator ad essere stato potenziato, ma gli stadi successivi che dovevano gestire il gran numero di triangoli generati dal tessellator) [...]
Qualcuno può dire qualcosa di preciso a riguardo?
calabar è offline  
Old 09-03-2010, 15:48   #21817
yossarian
Senior Member
 
Iscritto dal: Mar 2001
Messaggi: 5390
Quote:
Originariamente inviato da skizzo99999999 Guarda i messaggi
Ribadisco che i numeri che ho dato sono campati in aria e servono solo come esempi, ma ciò non toglie che secondo me parlare con un po di numeri aiuta. Ribadisco che quello che conta è quanto ci metto ad elaborare un frame completo di tutto: tutti i vertex, tutti i pixel, tutta la tessellazione, ecc... Mettiamo caso che un frame impieghi 16 millisedondi per essere eseguito sulla gpu1 con 480+T. In quei 16 msec, diciamo che la tessellazione ci mette 2 millisecondi. quindi per quei 2 millisendi io ho 480 sp occupati (facciamo finta che si abbia un utilizzo del 100% tanto per semplificare) più gli sp per hull e domain, mentre per i restanti 14 msec saranno occupati "soltanto" i 480 sp generici, con quelli per hull e domain a girarsi i pollici. Nella gpu2 a 512 sp, mettiamo (sempre per semplificare) di dedicare 32 sp alla tessellazione, quindi di rimanere con 480 sp generici per il resto. Quelle operazioni che prima richiedevano 2 msec, grazie alla minor efficienza degli sp generici (ma comunque relativa, visto le considerazione del post precedente) mettiamo che ne richiedono 3. Guardando gli atri 480sp, per quanto riguarda i primi 3 msec la situazione è uguale alla gpu1, presupponendo che si riesca ad occuparli tutti nonostante si abbiano meno dati in "uscita" dalla fase di tessellazione nell'unità di tempo, ma questo non possiamo saperlo (anche se il tessellator potenziato e diviso in 16 parti serve anche per poter offrire, oltre a una potenza totale maggiore anche una migliore granularità utile nel caso in questione). Negli gli altri 13 msec però, io ho a disposizione tutti e 512 gli sp, per cui posso eseguire il resto più velocemente (e quindi impiegare meno di 13 msec). Quindi rallentando una fase ho velocizzato il resto. Il fatto di dedicare 64, 128, 256, sp alla tessellazione invece che 32 non cambia il risultato: infatti gli sp "sottratti" serviranno a terminare prima la tessellazione in modo da liberarli prima per eseguire gli altri compiti, ma il tempo totale non cambia. Può essere utile per bilanciare meglio il carico in modo da tenere sempre più unità utilizzate, visto che le operazioni possono dipendere le une dalle altre ed eseguire massicciamente operazioni prima di un tipo poù essere utile per occupare meglio tutte le risorse a disposizione.
Faccicamo un altro esempio con la gpu2: mettiamo che gli sp eseguano una operazione ogni msec e ci mettano sempre un ciclo per ogni operazione (altra semplificazione, ma come sempre è per far capire): vuol dire che ho a disposizione 512 "cicli" per ogni msec, il che vuol dire 512x16=8192 cicli in totale occupati nel frame. Se io uso 32sp per hull e domai e ho detto che ci metto 3msec, vuol dire che l'operazione consuma 32x3=96 cicli. Me ne rimangono (480x3)+(512x13)=8096 a disposizione per il resto. Se io invece impiego subito 96sp, finisco tutto in 1 msec, per cui ho bruciato più sp subito, ma da'altro canto ci ho sempre messo 96 cicli, per cui ho sempre (416x1)+(512x15)=8096 per il resto. Se gli sp eseguissero invece una operazione più velocemente di un'altra allora il bialnciamento delle unità servirebbe a trovare il "punto" giusto in cui avere le migliori prestazioni, ma non è questo il nocciolo della questione. Il senso dell'esempio è che quello che conta è il tempo totale del frame, non della singola fase.

Come nel mio esempio precedente, è più o meno lo stesso principio del pixel e vertex shader contro shader unificati: questi ultimi, nonostante fossero meno efficienti (= più lenti) hanno permesso di sfruttare al meglio tutte le unità a disposizione in ogni momento, in modo da ganarare l'intero frame più velocemente. Qundi una scheda "full 512sp", cioè 512+T (che presuppone ulteriori sp per hull e domain) sarebbe si più veloce di una "512 senza T", ma sello stesso die size della 512+T magari ci posso mettere una 544 senza T. Il concetto è questo.
non hai tenuto conto di alcuni elementi:
1) gli Hull shader hanno unità constant function il cui lavoro deve essere emulato da quelle fp dello shader core (minore efficienza)
2) nell'esecuzione di VS, HS, DS, GS, PS, texture blending, sono richieste operazioni di thread switching; e tanto maggiore è il numero di tilogie di calcoli che una unità può eseguire, tanto più alto sarà la probabilità di dover eseguire uno switch (= cicli persi per ogni switch)
3) al contrario, se immagini un'elaborazione di tipo seriale (prima i VS, poi gli HS, poi la tessellation, quindi DS, GS, rasterizer) allora toriniamo al concetto di pipeline classica e si perde gran parte del vantaggio degli shader unificati.
In base a queste considerazioni, avere 512+T è meglio che avere 544 alu generiche a parità di die size.
4) se fai il raffronto con RV870 (perchè di questo si parla) il secondo è proprio nella situazione di chi ha 512+T.

Il discorso di Calabar è corretto: parliamo di un chip che ha un numero massimo di 512 alu teoriche che si confronta con un chip che ne ha 1600 (di tipo differente). Se faccio uso di tessellation il secondo continuerà ad avere 1600 alu dedicate a fare ciò che facevano anche prima, il primo non avrà più 512 alu dedicate agli stessi compiti ma decisamente meno e saranno tante di mneo quante più si deciderà di dedicarne alla tessellation. Discorso analogo a quello visto per physx: attivalo e vedrai il frame rate andare a picco e tanto più è pesante l'effetto implementato e tanto più è pesante il motore grafico, tanto più le prestazioni crollano. Fisicamente parlando un'unità o un cluster che si sta occupando di tessellare o di fare calcoli fisici non può, contemporaneamente fare altro.

Diciamo che nVidia ha scelto la strada che le permetteva di implemenatre il maggior numero possibile di unità di calcolo di generiche. Questo permette di avere una maggior efficienza dell'intera architettura ma una minor efficienza in ogni singolo task. D'altra parte, con un chip così complesso la strada era pressoche obbligata e l'adozione di unità dedicate avrebbe portato ad un ulteriore aumento delle dimensioni del chip per degli stadi che sono impiegati solo quando servono (in un gioco privo di tessellation, l'unità dedicata resta del tutto inattiva mentre quelle generiche le utilizzo per fare altro). In tal senso, anche la scelta di ricorrere alle unitàà di shading per il texture blending. Restano, però, come unità dedicate, quelle di texture sampling e addressing e quelle che fanno resolve per il MSAA box. Questo significa che la loro sostituzione comportava un eccessivo aumento delle unità generiche per compensare le perdite prestazionali (un'operazione di texture sampling richiede 20 cicli con unità generiche dove una dedicata se la cava con un singolo ciclo, ad esempio).

Ultima modifica di yossarian : 09-03-2010 alle 16:55.
yossarian è offline  
Old 09-03-2010, 15:54   #21818
yossarian
Senior Member
 
Iscritto dal: Mar 2001
Messaggi: 5390
Quote:
Originariamente inviato da calabar Guarda i messaggi

Credo che in questo Diobrando_21 abbia ragione: si può supporre che in un motore ben programmato faccia corrispondere alla tessellazione una diminuzione della necessità di potenza per il resto.
Quindi: no tessellation: SP liberi per il resto, tessellation: riversamento della potenza non più necessaria nel rendenring per fare tessellation.
Tutto sommato l'idea sembra buona, bisogna poi vedere i numeri della pratica.
la tessellation può essere usata per aumentare il dettaglio poligonale (e allora comporta un maggior peso di calcoli anche a valle) o per conservare lo stesso dettaglio migliorando l'occupazione di memoria e la banda passante occupata (ho meno vertici da immagazzinare all'interno dei buffer, ho meno vertici da trasferire attraverso il bus, ecc). In tal caso, a valle del tessellator, la complessità dei calcoli non diminuisce. Il vantaggio è che lavora meno la cpu perchè deve definire un numero inferiore di punti iniziali

Ultima modifica di yossarian : 09-03-2010 alle 16:12.
yossarian è offline  
Old 09-03-2010, 15:55   #21819
ghiltanas
Senior Member
 
L'Avatar di ghiltanas
 
Iscritto dal: Sep 2006
Messaggi: 27867
Quote:
Originariamente inviato da Diobrando_21 Guarda i messaggi
ok, ora è tutto più chiaro...grazie.

Però allora fermi avrà problemi x i discorsi suddetti, le ati hanno problemi non appena si attiva un minimo di tessellazione...io sinceramente non ne vedo più l'utilità...in entrambe i casi non vedo risultati che potrebbero soddisfarmi. È ovvio che se avremmo vga che stanno a 300fps senza e 100 con, sarò strafelice ma non credo proprio sia il caso di queste vga...che ne dite?
io dico che questa nn è la generazione del tessellation, e lo si vede anceh dal fatto che giochi che ne fanno uso intensivo ancora nn ce ne sono, e anche in uscita nn mi pare di aver sentito nulla a riguardo. Credo bisognerà attendere la seconda generazione di schede dx11, ati e nvidia miglioreranno sicuramente ò'hardware per tale scopo, e allora si spera sarà necessario.
Al momento entrambe le implementazioni vanno bene (sempre imho) proprio perchè tale features è implementata in maniera lieve
__________________
CPU: Ryzen 5700x COOLER: Noctua NH-D15S MOBO: Gigabyte b550 Professional RAM: 4x8 @3600 GPU: XfX Qick319 Rx6700XT HD1: Sk Hynix Platinum p41 2TB HD2: Sabrent Rocket 1TB MONITOR: Xaomi Mi Curved 34"
ghiltanas è offline  
Old 09-03-2010, 15:56   #21820
Alex656
Senior Member
 
Iscritto dal: Oct 2005
Città: Palmi
Messaggi: 913
Finalmente la discussione riacquista interesse con il confronto serrato tra Yoss e Skizzo...............alla faccia delle solite stupidaggini sulla manciata di frames in più o in meno del benckmark x o del gioco y.
__________________
PC1:Case CM690 II, Asus Crosshair VI Hero, Ryzen 9 5900x+Noctua NH-D15, 4x8 Gb Gskill Flarex 3200, Samsung EVO 840 256 Gb, Crucial P5 plus 1 Tb NVMe, Pioneer APS-SE20Q 1TB NVMe, Toshiba 3 Tb 7200.12, Asus Dual nVidia GeForce RTX 4070 Super Evo OC, Cooler Master 750W
PC2:Case CM TD500, Asus Tuf Gaming X870 Plus Wifi, Ryzen 7 5800-X3D, Thermalright PA120 SE ARGB, 2x16 Gskill FlareX 5, Crucial T705 1 Tb, Samsung 990 Pro 2 Tb, Asus Tuf Gaming RX 9070 XT OC Edition, ENERMAX Revolution III 850 Watt
Alex656 è offline  
 Discussione Chiusa


HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione HONOR Magic 8 Pro: ecco il primo TOP del 2026! L...
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata Insta360 Link 2 Pro e 2C Pro: le webcam 4K che t...
Motorola edge 70: lo smartphone ultrasottile che non rinuncia a batteria e concretezza Motorola edge 70: lo smartphone ultrasottile che...
Display, mini PC, periferiche e networking: le novità ASUS al CES 2026 Display, mini PC, periferiche e networking: le n...
Le novità ASUS per il 2026 nel settore dei PC desktop Le novità ASUS per il 2026 nel settore de...
DJI Mini 4 Pro Fly More Combo a 859€ su ...
Roborock in offerta su Amazon: QV 35A e ...
Crisi della RAM: Intel rassicura sul mer...
Dreame taglia i prezzi su Amazon: L40 Ul...
ChatGPT, arrivano gli annunci pubblicita...
iPhone Air a un nuovo minimo storico su ...
Datacenter e materie prime: Amazon acqui...
StackWarp: una nuova vulnerabilità...
Il telescopio spaziale James Webb ha cat...
Il razzo spaziale europeo Ariane 6 lance...
Il lander lunare Blue Origin Blue Moon M...
Gli LLM riescono a risolvere problemi ma...
Smettila con quei cioccolatini. Per San ...
Il secondo lancio del razzo spaziale eur...
MaiaSpace ed Eutelsat stringono un accor...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 10:42.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v