Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Nioh 3: souls-like punitivo e Action RPG
Nioh 3: souls-like punitivo e Action RPG
Nioh 3 aggiorna la formula Team NINJA con aree esplorabili più grandi, due stili di combattimento intercambiabili al volo (Samurai e Ninja) e un sistema di progressione pieno di attività, basi nemiche e sfide legate al Crogiolo. La recensione entra nel dettaglio su combattimento, build, progressione e requisiti PC
Test in super anteprima di Navimow i220 LiDAR: il robot tagliaerba per tutti
Test in super anteprima di Navimow i220 LiDAR: il robot tagliaerba per tutti
La facilità di installazione e la completa automazione di tutte le fasi di utilizzo, rendono questo prodotto l'ideale per molti clienti. Ecco com'è andata la nostra prova in anteprima
Dark Perk Ergo e Sym provati tra wireless, software via browser e peso ridotto
Dark Perk Ergo e Sym provati tra wireless, software via browser e peso ridotto
be quiet! debutta nel settore mouse da gaming con Dark Perk Ergo e Dark Perk Sym: due modelli gemelli per specifiche, con polling rate di 8.000 Hz anche in wireless, sensore PixArt PAW3950 da 32.000 DPI e autonomia dichiarata fino a 110 ore. Nel test, a 8.000 Hz si arriva a circa 30 ore reali, con ricarica completa in un'ora e mezza
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 29-06-2016, 23:24   #3941
cdimauro
Senior Member
 
L'Avatar di cdimauro
 
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
Per me programmatore, sì: è più facile per sfruttarle per fargli fare compiti più generali.

Ovviamente ciò ha un costo, eh!
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro
@LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro
Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys
cdimauro è offline  
Old 29-06-2016, 23:24   #3942
The_SaN
Senior Member
 
L'Avatar di The_SaN
 
Iscritto dal: Jun 2005
Città: Vitória(ES), Brasile
Messaggi: 8152
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Non intendevo quello...ma questo:

http://www.hwupgrade.it/forum/showpo...ostcount=31554

Il tizio nel link, dice che la sua regge 1290mhz con 0,1 in meno del def@1266

AMD si è tenuta molto larga con le tensioni. A questo potrebbe essere dovuto il consumo eccessivo.

Con ste schede stanno facendo cassa, buttano dentro tutti i chip, anche quelli scrausi che non reggono le frequenze target, alzandogli il vgpu..
Questa spiegazione sui consumi eccessivi, mi soddisfa abbastanza.
Cavoli ho postato questa possibilità poco fa sul thread "Aspettando"
__________________
Se la vita ti da limoni ... Spremili in occhio a qualcuno e corri!
The_SaN è offline  
Old 29-06-2016, 23:28   #3943
george_p
Senior Member
 
L'Avatar di george_p
 
Iscritto dal: Sep 2005
Messaggi: 2177
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Per me programmatore, sì: è più facile per sfruttarle per fargli fare compiti più generali.

Ovviamente ciò ha un costo, eh!
Ah ok. Mi viene da pensare che questo faccia parte dei piani HSA di amd e consorzio.
__________________
__________
Configurazione:
Mainboard Gigabyte G1.Sniper A88X (rev. 3.0) ; APU A10 7850K ; HDD Western Digital SATA III  WD Blue 1 TB ; Ram Corsair 1866 mhz 16 gb ; OS Seven premium 64 bit
george_p è offline  
Old 29-06-2016, 23:34   #3944
davo30
Senior Member
 
L'Avatar di davo30
 
Iscritto dal: Jul 2012
Messaggi: 2824
Quote:
Originariamente inviato da george_p Guarda i messaggi
Ma cosa vi aspettavate consumasse 40 w per andare quanto una 390?
Il rapporto di cui scrive Grid invece è riferito alla 470 ed è scritto in una delle slide presentate al computex da amd, come riportato da Mitch di B&C.
Il fatto che molti lo avessero associato alla 480 piuttosto che alla 470 è altra cosa.

Non avrà ancora i consumi delle nvidia amd ma la 480 è stata confrontata con una 970 overcloccata, se non sbaglio pure custom (quindi più efficiente) e decisamente molto più rodata lato drivers, al pari delle precedenti sempre amd.
Senza considerare che queste sono pronte per DX 12 mentre ...altre no.

Solo quando i consumi alti sono di nvidia non frega una fava a nessuno e si guardano altre cose

Intanto però i prezzi sono tutt'altro pianeta
Il problema sono i consumi rispetto alla 1070. Ripeto, non me ne frega una fava, la acquisterò comunque (o la 470, dipende dalle mie finanze tra un mesetto), pero il rapporto tra i consumi della 480 e della 1070 e le prestazioni è abbastanza impietoso.
Speriamo non siano problemi legati al silicio ma all'architettura GCN, altrimenti siamo di fronte all'ennesimo fail di Goffofoundries
__________________
AMD R5 3600 | MSI B450 Tomahawk Max II | 16gb Viper 3000MHz CL17 | AMD XFX RX 5700XT DD 8GB | SSD Patriot 240GB | SSD Kingdian 500GB | Super Flower Amazon 550W | Zalman Z11
davo30 è offline  
Old 29-06-2016, 23:36   #3945
Piedone1113
Senior Member
 
Iscritto dal: Jul 2015
Messaggi: 5595
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
A me ricorda Xeon Phi: massiccia unità vettoriale con annessa unità scalare, ampio register set, cache L1 ed L2, e addirittura istruzioni intere con meno di 32 bit (16 bit), tipiche nei CISC.

La tendenza delle GPU è di diventare sempre più tuttofare. Ecco perché dicevo che sono sempre più simili alle CPU.
Esattamente, ma credo che questo chip andrà in apu (sue evoluzioni in zen+ core) e forse Soc per consolle.
Piedone1113 è offline  
Old 29-06-2016, 23:41   #3946
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
La slide riporta che i core Zen siano "6-wide", e dunque abbiano la capacità di eseguire 6 istruzioni per ciclo di clock. Questo cozza con le altre informazioni che circolano, che parlano di core a 4 vie.
ne abbiamo discusso io e bjt2, e siamo arrivati alla conclusione che il 6 wide si riferisca al numero di pipeline integer.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
La cache L1 è data come 64K + 64K per codice e dati, quindi come i vecchi Athlon/Athlon64, ma questo si discosta dalle altre informazioni che riportano, invece, 32K + 32K
il 32K+32K, è stato teorizzato da dresdenboy poichè ci sono brevetti AMD sulla cache che riportano quelle dimensioni...in quel caso è più attendibile il CERN

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Infine 8MB di cache L3 per 16 core è un valore troppo basso: sarebbero 512KB per core, cioé quanto la cache L2 per core. Considerato che AMD dovrebbe cambiare la gerarchia della cache da esclusiva a inclusiva, la L3 dovrebbe essere più grande della L2 totale per dare un maggior contributo alle prestazioni.
anche perchè con una cache inclusiva non servirebbe a niente...
8MB sono per il modulo, che è composto da 4 core..
il 16 core avrà 32MB di cache l3.
invece non è chiaro ad oggi se l'apu HPC, ma anche quella consumer, avrà o meno la l3...in fin dei conti 512kb di cache l2 per core non sono pochissimi.



Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Quanto a Doom, si sa quanti FPS generava, a che frequenza girava Zen, e la configurazione hardware utilizzata? Altrimenti sapere che ci gira è del tutto inutile
non lo so.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Per uno step, ce ne vogliono minimo 2, ma si può arrivare tranquillamente anche 3 (non ricordo se si arriva a più di 3), soprattutto coi primi step, che sono decisamente bacati.
considera che è un'architettura nuova che può presentare più di qualche baco...

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Sempre più simili a delle CPU, queste GPU.
soprattutto GCN, e per questo da una parte si pensa che sembrano sempre meno adatte ai giochi...
anche il numero di transistor è molto alto considerando che ci sono la metà di MC e di ROPs, solo 80% di stream processor....5,7 vs 6,2 miliardi...ovvero il 92%....
o c'è qualche CU e ROPs nascosta, o davvero hanno "sprecato" tantissimi transistor per il gpgpu..

EDIT sull'apu HPC da 16 core, oltre ai rumors, anche un progettista di cpu, senza nome (non me lo ricordo) ha teorizzato che sia un puzzle composto da 2 die ZEN e da Polaris...infatti la natura SoC, e il fatto stesso che le HBM2 necessitano dell'interposer rendono poco conveniente, l'approccio monolitico.

Ultima modifica di tuttodigitale : 29-06-2016 alle 23:56.
tuttodigitale è offline  
Old 30-06-2016, 00:01   #3947
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 32025
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Non intendevo quello...ma questo:

http://www.hwupgrade.it/forum/showpo...ostcount=31554

Il tizio nel link, dice che la sua regge 1290mhz con 0,1 in meno del def@1266

AMD si è tenuta molto larga con le tensioni. A questo potrebbe essere dovuto il consumo eccessivo.

Con ste schede stanno facendo cassa, buttano dentro tutti i chip, anche quelli scrausi che non reggono le frequenze target, alzandogli il vgpu..
Questa spiegazione sui consumi eccessivi, mi soddisfa abbastanza.
Io non seguo le VGA e quindi non so una mazza di sigle e quant'altro. Ma se ho capito bene, non hanno semplicemente fatto il passaggio sul 14nm non cambiando nulla?
Secondo me ci può stare un leggero overvolt a scapito dei consumi ma a pro del prezzo, in fin dei conti cosi non deve spendere di più nella selezione e comunque il 14nm da margine.
Secondo me AMD tira a fare legna, per me AMD non ha il tempo per affinare silicio, non ha i soldi e ha una gran fretta di mettere in commercio prodotti sia per incassare e sia per dare una base certa e credibile che il 14nm esiste.
paolo.oliva2 è offline  
Old 30-06-2016, 00:03   #3948
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Non intendevo quello...ma questo:

http://www.hwupgrade.it/forum/showpo...ostcount=31554

Il tizio nel link, dice che la sua regge 1290mhz con 0,1 in meno del def@1266

AMD si è tenuta molto larga con le tensioni. A questo potrebbe essere dovuto il consumo eccessivo.

Con ste schede stanno facendo cassa, buttano dentro tutti i chip, anche quelli scrausi che non reggono le frequenze target, alzandogli il vgpu..
Questa spiegazione sui consumi eccessivi, mi soddisfa abbastanza.
avevo letto su altri lidi, che non si poteva occare senza cambiare tensione...d'altra parte anche le slide di AMD mi hanno portato a pensare, che AMD non si sia tenuta larga con le tensioni.

L'importante è che risolvano per Vega.

Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Secondo me AMD tira a fare legna, per me AMD non ha il tempo per affinare silicio, non ha i soldi e ha una gran fretta di mettere in commercio prodotti sia per incassare e sia per dare una base certa e credibile che il 14nm esiste.
fino a ieri proponeva, nella fascia dei 300 euro in giù, schede del 2011. E considerando che è li dove si fanno i soldi, AMD ha quantomeno cercato di mettere una pezza con prodotti meno costosi da produrre...alla fine è uscito un prodotto con un rapporto prezzo/prestazioni molto buono.

Ultima modifica di tuttodigitale : 30-06-2016 alle 00:09.
tuttodigitale è offline  
Old 30-06-2016, 00:06   #3949
george_p
Senior Member
 
L'Avatar di george_p
 
Iscritto dal: Sep 2005
Messaggi: 2177
Quote:
Originariamente inviato da davo30 Guarda i messaggi
Il problema sono i consumi rispetto alla 1070. Ripeto, non me ne frega una fava, la acquisterò comunque (o la 470, dipende dalle mie finanze tra un mesetto), pero il rapporto tra i consumi della 480 e della 1070 e le prestazioni è abbastanza impietoso.
Speriamo non siano problemi legati al silicio ma all'architettura GCN, altrimenti siamo di fronte all'ennesimo fail di Goffofoundries
Come sarà pietoso per la 1070 con le DX 12
__________________
__________
Configurazione:
Mainboard Gigabyte G1.Sniper A88X (rev. 3.0) ; APU A10 7850K ; HDD Western Digital SATA III  WD Blue 1 TB ; Ram Corsair 1866 mhz 16 gb ; OS Seven premium 64 bit
george_p è offline  
Old 30-06-2016, 00:36   #3950
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24171
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Visto il FO4 e il Vcore di queste GPU, a me quello che preme è la frequenza a parità di transistors e potenza dissipata e secondariamente il Vcore, per vedere quanto si è tirati... A quale modello TONGA è paragonabile come numero di transistors, o almeno shader? Che potenza? Che frequenza? Che vcore?

Avevamo fatto qualche pagina indietro il conto: a parità di transistors, +20% di frequenza anche a parità di potenza dissipata e -0.05V di Vcore.

Per quanto riguarda Zen, siccome a 28nm non c'è qualcosa di paragonabile a Zen come numero di transistors, si prende o uno XV x4 a 25W e si aggiunge un 20% di frequenza, o un BD (non ricordo l'ultimo sul 28nm, mi pare piledriver) x8 a 45W (se esiste) e si aggiunge il 20% di frequenza...



Per ZEN intendevo un rapporto prezzo/prestazioni/consumo molto simile a Polaris; per le CPU "costose" bisognerà aspettare...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 30-06-2016, 00:46   #3951
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Sempre più simili a delle CPU, queste GPU.
Naaa, solo GCN.

Maxwell (e anche Pascal) sono molto più semplici..
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 30-06-2016, 00:47   #3952
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da Piedone1113 Guarda i messaggi
Mi sembra quasi un coprocessore vettoriale. ☺
Credo che Vega sarà strutturaro diversamente più efficiente ma meno tuttofare.
Hmm..purtroppo no. E' da GCN1 che hanno quello schema..

Il problema "grosso" di GCN è proprio quello: è nata per "Fusion" e per le console.
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 30-06-2016, 00:50   #3953
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da The_SaN Guarda i messaggi
Cavoli ho postato questa possibilità poco fa sul thread "Aspettando"
Ho visto.
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 30-06-2016, 00:53   #3954
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Secondo me AMD tira a fare legna, per me AMD non ha il tempo per affinare silicio, non ha i soldi e ha una gran fretta di mettere in commercio prodotti sia per incassare e sia per dare una base certa e credibile che il 14nm esiste.

Con Polaris questo è certo l'obiettivo principale resta da vedere se ci riesce con questo progetto oppure no...

Se riescono a tenere i prezzi sui 250, anche delle custom (una volta assestati), allora ne venderanno a vagonate.
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 30-06-2016, 01:30   #3955
digieffe
Senior Member
 
L'Avatar di digieffe
 
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Infine 8MB di cache L3 per 16 core è un valore troppo basso: sarebbero 512KB per core, cioé quanto la cache L2 per core. Considerato che AMD dovrebbe cambiare la gerarchia della cache da esclusiva a inclusiva, la L3 dovrebbe essere più grande della L2 totale per dare un maggior contributo alle prestazioni.
la L3 pur essendo delle stesse dimensioni della L2 (quindi essendo inclusiva con lo stesso contenuto) potrebbe servire per "spiare e comunicare" (snooping?) il contenuto delle cache degli altri core lasciando libera la L2
digieffe è offline  
Old 30-06-2016, 07:16   #3956
cdimauro
Senior Member
 
L'Avatar di cdimauro
 
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
Quote:
Originariamente inviato da tuttodigitale Guarda i messaggi
ne abbiamo discusso io e bjt2, e siamo arrivati alla conclusione che il 6 wide si riferisca al numero di pipeline integer.
Mah. Non credo che abbiano commesso un errore madornale come quello di contare soltanto le porte per gli interi, peraltro trascurando del tutto quelle FP che sono quelle più interessanti proprio per i tipi di calcoli che si fanno al CERN.

Inoltre in letteratura wide si usa per indicare il numero di istruzioni che sono decodificate e/o eseguite (quindi nemmeno uop: sono istruzioni dell'ISA).

Questa cosa, insomma, mi puzza abbastanza, ma considerato che AMD parla del 40% di IPC in più, potrebbe esserne proprio la chiave di lettura.
Quote:
il 32K+32K, è stato teorizzato da dresdenboy poichè ci sono brevetti AMD sulla cache che riportano quelle dimensioni...in quel caso è più attendibile il CERN
Può essere, perché i brevetti, alla fine, possono riportare degli esempi di utilizzo, ma l'implementazione dell'idea potrebbe benissimo avere "misure" diverse.

Come mai ritieni più attendibile l'informazione del CERN? Perché AMD ritorna al design che l'ha resa celebre, con K7 e K8 aventi ben 64+64 KB di cache L1?
Quote:
anche perchè con una cache inclusiva non servirebbe a niente...
8MB sono per il modulo, che è composto da 4 core..
il 16 core avrà 32MB di cache l3.
Esattamente: è proprio questo che fa storcere il naso. La trovo di poca utilità, anche se c'è da dire che a 14nm quegli 8MB di cache L3 occupano poco spazio rispetto al resto del chip.

D'altra parte mi pare che Apple con l'A9X abbia del tutto rimosso la cache L3, se la memoria non m'inganna, e le prestazioni non sono calate di molto (vista la generosa e veloce cache L2).
Quote:
invece non è chiaro ad oggi se l'apu HPC, ma anche quella consumer, avrà o meno la l3...in fin dei conti 512kb di cache l2 per core non sono pochissimi.
No, ma bisogna vedere com'è fatta la componente GPU integrata: quanta cache L2 ha per i core, e se sono in grado di farcela senza l'appoggio della L3.

Le GPU, lo sappiamo, sono affamatissime di banda, ed è anche il motivo per cui, oltre alla generosa L3, le CPU Intel top di gamma montano 64 o ben 128MB di cache L4 (che però, come la L3, viene usata anche dalla CPU).
Quote:
soprattutto GCN, e per questo da una parte si pensa che sembrano sempre meno adatte ai giochi...
anche il numero di transistor è molto alto considerando che ci sono la metà di MC e di ROPs, solo 80% di stream processor....5,7 vs 6,2 miliardi...ovvero il 92%....
o c'è qualche CU e ROPs nascosta, o davvero hanno "sprecato" tantissimi transistor per il gpgpu..
Propendo per la seconda, ed è una cosa che è davvero strana: è da anni che, IMO, AMD sbaglia a seguire questa strada.

Dovrebbe realizzare core GPU orientati esclusivamente all'elaborazione della grafica, come fa nVidia.

Il GPGPU computing in ambito consumer non ha preso piede, ed è ben lungi dal farlo solo perché AMD presenta GPU con buone capacità in tal senso.

Ha senso soltanto per il settore HPC e per particolari tipologie di server, e dunque in settori molto redditizi dove si può permettere di sviluppare apposite varianti.
Quote:
EDIT sull'apu HPC da 16 core, oltre ai rumors, anche un progettista di cpu, senza nome (non me lo ricordo) ha teorizzato che sia un puzzle composto da 2 die ZEN e da Polaris...infatti la natura SoC, e il fatto stesso che le HBM2 necessitano dell'interposer rendono poco conveniente, l'approccio monolitico.
Quindi ci sarà l'HBM2 integrata? Non so, a questo punto, quanto senso abbia integrare ben 2 die ZEN, quando la parte del leone dovrebbe farla la GPU integrata, che non ha problemi a gestire basse latenze di accesso alla memoria, e bus molto ampi.

Roba che, insomma, non è molto affine ai core di una CPU, che sono pensati per lavorare in maniera quasi diametralmente opposta.

IMO avrebbero fatto meglio a piazzare un piccolo core x86 di controllo/supporto, lasciando la maggior parte del silicio alla GPU.

Mie personalissime riflessioni, come sempre.
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Naaa, solo GCN.

Maxwell (e anche Pascal) sono molto più semplici..
In tutta onestà, e come già detto (ma non da ora), fa benissimo così.
Quote:
Originariamente inviato da digieffe Guarda i messaggi
la L3 pur essendo delle stesse dimensioni della L2 (quindi essendo inclusiva con lo stesso contenuto) potrebbe servire per "spiare e comunicare" (snooping?) il contenuto delle cache degli altri core lasciando libera la L2
Il processore ha già logica di bus snooping (o simile) a prescindere, perché rimangono comunque le cache L1 e L2 che devono essere coerenti con quanto presente in memoria o sulle cache degli altri core.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro
@LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro
Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys
cdimauro è offline  
Old 30-06-2016, 08:06   #3957
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
A me ricorda Xeon Phi: massiccia unità vettoriale con annessa unità scalare, ampio register set, cache L1 ed L2, e addirittura istruzioni intere con meno di 32 bit (16 bit), tipiche nei CISC.

La tendenza delle GPU è di diventare sempre più tuttofare. Ecco perché dicevo che sono sempre più simili alle CPU.
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Per me programmatore, sì: è più facile per sfruttarle per fargli fare compiti più generali.

Ovviamente ciò ha un costo, eh!
Da poco più di 2 anni abbiamo comprato un sistema socket 2011 in un rack 19" con 2 GTX 690 in SLI, viste come 4 GPU. Le usiamo per il GPGPU e mi sono studiato l'architettura. Anche li (e che io sappia anche in architetture precedenti) c'è una unità scalare, mi pare 4 ogni 192. Sono usate anche per le funzioni trascendenti. Il filtro Non Local Mean che abbiamo implementato, usa exp e mi ero fatto il calcolo per vedere se eravamo limitati da quello. Purtroppo siamo limitati dalla banda L1 (neanche da quella RAM) perchè l'algoritmo è abbastanza semplice (ma non troppo semplice da essere limitati dalla banda RAM).

Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi


Per ZEN intendevo un rapporto prezzo/prestazioni/consumo molto simile a Polaris; per le CPU "costose" bisognerà aspettare...
Quindi siamo passati da 190W@970MHz per 2048 shader a 150W@1265MHz per 2304 shader... E c'è chi non è contento? Andiamo bene! Questo fa ben sperare per Zen. +30% di clock, +15% di shaders e -20% di TDP...

Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Naaa, solo GCN.

Maxwell (e anche Pascal) sono molto più semplici..
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Hmm..purtroppo no. E' da GCN1 che hanno quello schema..

Il problema "grosso" di GCN è proprio quello: è nata per "Fusion" e per le console.
Vedi sopra...

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Mah. Non credo che abbiano commesso un errore madornale come quello di contare soltanto le porte per gli interi, peraltro trascurando del tutto quelle FP che sono quelle più interessanti proprio per i tipi di calcoli che si fanno al CERN.

Inoltre in letteratura wide si usa per indicare il numero di istruzioni che sono decodificate e/o eseguite (quindi nemmeno uop: sono istruzioni dell'ISA).

Questa cosa, insomma, mi puzza abbastanza, ma considerato che AMD parla del 40% di IPC in più, potrebbe esserne proprio la chiave di lettura.

Può essere, perché i brevetti, alla fine, possono riportare degli esempi di utilizzo, ma l'implementazione dell'idea potrebbe benissimo avere "misure" diverse.

Come mai ritieni più attendibile l'informazione del CERN? Perché AMD ritorna al design che l'ha resa celebre, con K7 e K8 aventi ben 64+64 KB di cache L1?

Esattamente: è proprio questo che fa storcere il naso. La trovo di poca utilità, anche se c'è da dire che a 14nm quegli 8MB di cache L3 occupano poco spazio rispetto al resto del chip.

D'altra parte mi pare che Apple con l'A9X abbia del tutto rimosso la cache L3, se la memoria non m'inganna, e le prestazioni non sono calate di molto (vista la generosa e veloce cache L2).

No, ma bisogna vedere com'è fatta la componente GPU integrata: quanta cache L2 ha per i core, e se sono in grado di farcela senza l'appoggio della L3.

Le GPU, lo sappiamo, sono affamatissime di banda, ed è anche il motivo per cui, oltre alla generosa L3, le CPU Intel top di gamma montano 64 o ben 128MB di cache L4 (che però, come la L3, viene usata anche dalla CPU).

Propendo per la seconda, ed è una cosa che è davvero strana: è da anni che, IMO, AMD sbaglia a seguire questa strada.

Dovrebbe realizzare core GPU orientati esclusivamente all'elaborazione della grafica, come fa nVidia.

Il GPGPU computing in ambito consumer non ha preso piede, ed è ben lungi dal farlo solo perché AMD presenta GPU con buone capacità in tal senso.

Ha senso soltanto per il settore HPC e per particolari tipologie di server, e dunque in settori molto redditizi dove si può permettere di sviluppare apposite varianti.

Quindi ci sarà l'HBM2 integrata? Non so, a questo punto, quanto senso abbia integrare ben 2 die ZEN, quando la parte del leone dovrebbe farla la GPU integrata, che non ha problemi a gestire basse latenze di accesso alla memoria, e bus molto ampi.

Roba che, insomma, non è molto affine ai core di una CPU, che sono pensati per lavorare in maniera quasi diametralmente opposta.

IMO avrebbero fatto meglio a piazzare un piccolo core x86 di controllo/supporto, lasciando la maggior parte del silicio alla GPU.

Mie personalissime riflessioni, come sempre.

In tutta onestà, e come già detto (ma non da ora), fa benissimo così.

Il processore ha già logica di bus snooping (o simile) a prescindere, perché rimangono comunque le cache L1 e L2 che devono essere coerenti con quanto presente in memoria o sulle cache degli altri core.

Interessante! Se 6 wide vuol dire che ha 6 decoder, è una ottima notizia... Daltronde un modulo XV ne ha 8 per 2 thread, ma 4+4, quindi 6 decoder, magari unificati, per la teoria delle code non è tanto peggio di un 4+4!
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline  
Old 30-06-2016, 08:09   #3958
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Mah. Non credo che abbiano commesso un errore madornale come quello di contare soltanto le porte per gli interi, peraltro trascurando del tutto quelle FP che sono quelle più interessanti proprio per i tipi di calcoli che si fanno al CERN.
nelle patch i decoder risultato 4.. in effetti se si riferissero al wide-dispatch sarebbe molto più stretta di quello che siamo pensati a pensare.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Inoltre in letteratura wide si usa per indicare il numero di istruzioni che sono decodificate e/o eseguite (quindi nemmeno uop: sono istruzioni dell'ISA).
per wide in letteratura si può intendere qualsiasi cosa....per quel che ne sappiamo potrebbe essere un 6 wide-issue OoO e la cosa avrebbe anche il suo senso...

aggiungo un dato: il fattore di scaling dai 28 ai 14nm per le gpu AMD è pari a solo a 1,7x...se questo fosse vero anche per la CPU il die ZEN sarebbe grande 251mmq.

Ultima modifica di tuttodigitale : 30-06-2016 alle 08:28.
tuttodigitale è offline  
Old 30-06-2016, 08:54   #3959
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Come mai ritieni più attendibile l'informazione del CERN? Perché AMD ritorna al design che l'ha resa celebre, con K7 e K8 aventi ben 64+64 KB di cache L1?
No. Perchè c'è la possibilità che il CERN abbia avuto informazioni aggiuntive. Tutto qui.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Esattamente: è proprio questo che fa storcere il naso. La trovo di poca utilità, anche se c'è da dire che a 14nm quegli 8MB di cache L3 occupano poco spazio rispetto al resto del chip.
non capisco è troppa o troppo poca. Alla fine sono 2MB vs 2,5MB degli XEON Intel...non vedo sta grande differenza.
Se invece ti riferisci alle dimensioni della L2, potrebbe anche essere dovuta ad algoritmi non infallibili per la predizione dei rami, a pensar male..

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Dovrebbe realizzare core GPU orientati esclusivamente all'elaborazione della grafica, come fa nVidia.
auspichi un ritorno al vliw?

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
No, ma bisogna vedere com'è fatta la componente GPU integrata: quanta cache L2 ha per i core, e se sono in grado di farcela senza l'appoggio della L3
l'esperto sei tu, ma non penso che sia così determinante il quantitativo di l2...comunque sono 64-128KB per CU a seconda della GPU. AMD parla di modulo ZEN, quindi sono in parte tentato a pensare che la l3 sarà sempre presente...

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Quindi ci sarà l'HBM2 integrata?.
pare proprio di si. Anzi credo che il fine ultimo dello sviluppo delle HBM sia proprio il mercato server.

Quote:
Originariamente inviato da digieffe Guarda i messaggi
la L3 pur essendo delle stesse dimensioni della L2 (quindi essendo inclusiva con lo stesso contenuto) potrebbe servire per "spiare e comunicare" (snooping?) il contenuto delle cache degli altri core lasciando libera la L2
di solito è contro indicato avere cache inclusive delle stesse dimensioni, e si usa una victim cache.

ma nel caso di ZEN abbiamo un modulo
4 core
L2 512KB ciascuno (2MB complessivi)
L3 8MB condivisi.

Ultima modifica di tuttodigitale : 30-06-2016 alle 08:57.
tuttodigitale è offline  
Old 30-06-2016, 09:10   #3960
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da gridracedriver Guarda i messaggi
si ma non devi migliorare solo te stesso, ma anche rispetto alla concorrenza, quanto meno stare al passo lato efficienza.
in realtà non ha neppure migliorata se stessa...
è riuscita "solo" ad aumentare il clock del 25% senza perdere in efficienza. Un pò troppo poco...vedi la fury
https://tpucdn.com/reviews/AMD/RX_48..._2560_1440.png
tuttodigitale è offline  
 Discussione Chiusa


Nioh 3: souls-like punitivo e Action RPG Nioh 3: souls-like punitivo e Action RPG
Test in super anteprima di Navimow i220 LiDAR: il robot tagliaerba per tutti Test in super anteprima di Navimow i220 LiDAR: i...
Dark Perk Ergo e Sym provati tra wireless, software via browser e peso ridotto Dark Perk Ergo e Sym provati tra wireless, softw...
DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker DJI RS 5: stabilizzazione e tracking intelligent...
AMD Ryzen 7 9850X3D: Zen 5, 3D V-Cache e frequenze al top per il gaming AMD Ryzen 7 9850X3D: Zen 5, 3D V-Cache e frequen...
SpaceX sta per rimuovere il braccio di a...
Sony a ISE 2026: display, soluzioni imme...
Sony punta sull'IA: brevettati i podcast...
Logitech G Astro A50, le cuffie gaming d...
Lenovo a ISE 2026: smart collaboration, ...
GeForce RTX 5000 SUPER cancellate e RTX ...
Substack conferma violazione: esposti da...
L'IA costa caro. Oracle punta a raccogli...
OpenAI lancia Frontier: il cervello cent...
Questo robot aspirapolvere lava sempre c...
Il PC non si avvia? ASRock invita a cont...
8 smartphone Android in forte sconto su ...
Samsung House apre a Milano: la casa tec...
Broadcom esclude i cloud provider pi&ugr...
Allerta sicurezza per n8n: come protegge...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 18:01.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v