|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#901 | |
|
Senior Member
Iscritto dal: Jan 2006
Città: Grosseto
Messaggi: 13656
|
Quote:
64 cuori sono una bella roba.. a boinc potrei salire alle prime posizioni...
__________________
decine di trattative positive su hwupgrade! Configurazione: Gigabyte B550I AORUS PRO AX , AMD Ryzen 5950X, NVIDIA GeForce 4060Ti MSI GamingX 16GB, Silverstone strider 600W 80+ titanium, GSkill Trident 2X8@4000 MHz, Sabrent Rocket 4.0 Plus 2TB, Silverstone SG09, Samsung Gaming Monitor C49RG90 |
|
|
|
|
|
#902 | ||
|
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Quote:
Parlando sempre di performance secondo me ormai è più indicato considerare i thread più che i core. Vedremo in futuro se amd riuscirà ad estrarre maggior parallelismo scindendo i core, invece di tener alu maggiormente occupate con SMT. Quote:
Il bus del K10 è un 128+64, quindi facendo parallelo ci vorrebbero due cicli di clock. La mia idea nasce dal principio (forse errato) che aumentare eccessivamente il bus "di ogni via" dovrebbe essere uno spreco laddove si usano prevalentemente istruzioni intere 64bit. Ultima modifica di Ren : 07-06-2010 alle 15:30. |
||
|
|
|
|
#903 | ||
|
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Quote:
Quote:
Ultima modifica di Ren : 07-06-2010 alle 15:37. |
||
|
|
|
|
#904 | |
|
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
In effetti bus ampi richiedono più transistor, qui bjt2 ne saprà più di me e potrà dirci lui. Il fatto è prevedere se le avx a 256bit saranno utilizzate molto nei programmi vari, applicativi professionali e giochini vari. Solo dopo si potrà dire se un probabile aumento del bus sia stato utile. Comunque è vero, hai ragione
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita |
|
|
|
|
|
#905 | |
|
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
E dove magny c con 12 cores reali va molto bene aggiungerei.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita |
|
|
|
|
|
#906 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#907 |
|
Senior Member
Iscritto dal: Jan 2006
Città: Grosseto
Messaggi: 13656
|
Ma non è un peccato allora che neppure il prossimo windows sia a 128 bit? quanto incrementerebbero le prestazioni? o non c'entra niente..?
__________________
decine di trattative positive su hwupgrade! Configurazione: Gigabyte B550I AORUS PRO AX , AMD Ryzen 5950X, NVIDIA GeForce 4060Ti MSI GamingX 16GB, Silverstone strider 600W 80+ titanium, GSkill Trident 2X8@4000 MHz, Sabrent Rocket 4.0 Plus 2TB, Silverstone SG09, Samsung Gaming Monitor C49RG90 |
|
|
|
|
#908 | ||||
|
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Quote:
Ti confermo (amdzone) che le unità fmac mantengono piena compatibilità con le sse/x87 con un minomo degrado prestazionale, circola anche un pdf con lo studio delle performance. Quote:
Quote:
Il tuo paragone è calzante per i processori non general purpose. Quote:
Ho semplicemente detto che SMT permette un ottimo boost prestazionale, perchè maschera le latenze ed ottimizza il carico, rendendo meno gravose le bolle nella pipeline. Ultima modifica di Ren : 07-06-2010 alle 16:43. |
||||
|
|
|
|
#909 | |
|
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
Attenzione però, il SMT da un boost prestazionale buono se lo scheduler del S.O fa un ottimo lavoro, sopratutto se assegna ad i core logici i thread con poco lavoro di memoria, visto che alla fine hai LSu e agu dimezzate. Quindi in ambito server, a meno di particolari architetture come quella di IBM che è più efficiente in questo campo del nehalem, almeno cosi ho letto, meglio più cores fisici che logici. Ed ovviamente tonnellate di mem bandwidth. Edit: Pensavo fosse noto che amd ha mantenuto adder e multiplier separati, altrimenti a che prò implementare le avx se con le istruzioni vecchie hai cali notevoli di performance?
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita Ultima modifica di Pihippo : 07-06-2010 alle 17:26. |
|
|
|
|
|
#910 | |
|
Member
Iscritto dal: Nov 2009
Messaggi: 78
|
Quote:
Qui nei forum leggo spesso commenti curiosi, tipo che è un peccato che amd non abbia implementato l'smt su BD. Il punto chiave dell'architettura nuova è proprio che NON ha voluto farlo! L'SMT non è Gratis: bisogna "spendere" transistor per realizzarlo, Intel mi pare che a suo tempo aveva dichiarato un 5% di transistor in più sull'insieme della cpu, ora amd dichiara (mi pare) che per un 10% in più di transistor ti dà un core in più. Quindi: spendo il 5% in più per avere circa il 20% di performance in più o il 10% per l'80% di performance in più? Amd ha scelto la seconda... Solo il tempo ci dirà chi ha fatto le scelte migliori... |
|
|
|
|
|
#911 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
Il supporto alle SSE e AVX deve essere presente a livello di SO (è anche a quello, credo, che servano i drivers del processore), perchè a ogni task switch devono essere conservati. Infatti sia le estensioni SSE che AVX devono per prima cosa essere supportade dalla CPU, e infine supportate e ABILITATE dal SO, che deve sapere che a ogni task switch deve allocare lo spazio per i registri a 128/256 bit nella memoria del kernel. Questo perchè esiste una istruzione specifica delle CPU x86 che fa tutto il lavoro sporco di salvare i registri. Però deve essere allocato lo spazio sufficiente...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#912 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#913 | |
|
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Quote:
|
|
|
|
|
|
#914 | |
|
Member
Iscritto dal: Nov 2009
Messaggi: 78
|
Quote:
Sembra che siano giuste tutte e due le nostre cifre.... cambia solo il punto di vista... |
|
|
|
|
|
#915 | |
|
Member
Iscritto dal: Nov 2009
Messaggi: 78
|
Quote:
ti riferisci alla tag per l'indirizzo fisico? può essere, nel senso che fa i suoi look up alle tag ram (una per via) nel tempo di un ciclo per la decodifica dell'indirizzo. Cmq la latenza di accesso è sempre di 3 cicli: il primo si decodifica l'indirizzo, al secondo si va a pescare il dato, al terzo lo si inoltra, il processo è ovviamente pipeline-izzato e la cache ha due porte (a 64 bit nel k8 e 128 nel k10), quindi fornisce due dati per ciclo di clock. 64 KB, 2 vie, 8 banchi, 64 byte line size, true LRU |
|
|
|
|
|
#916 | |
|
Senior Member
Iscritto dal: Apr 2003
Messaggi: 591
|
Quote:
Nelle roadmap bulldozer&llano@32nm sono sempre stati riportati nel 2011. Da un paio di anni. (basta fare una ricerca rapida su google) |
|
|
|
|
|
#917 | |
|
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
Il tag è la parte più significativa dell'indirizzo dell' operando che risiede nella cache, ovvero il tag è quello che controlla l'hardware per vedere se il dato\operando è giusto, se è giusto si ha un hit e la cpu lo preleva dalla cache, grazie ad i prefetcher comunque l'hit rate è molto alto poichè di solito riescono a caricare preventivamente il dato nella cache. Purtroppo invece se il dato non è nella cache e lo si vuole prelevare bisogna calcolarne l'indirizzo, altrimenti le agu che ci starebbero a fare? quindi da ignorante totale posso dire con certezza al 10% che il cache tag non ti rappresenta l'idirizzo fisico nella ram dell'operando. ![]() Edit: Ma la politica della cache Lru è cosi perchè è facile da realizzare con 128kb di L1? http://www.dis.uniroma1.it/~alberto/...tori/cache.pdf
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita Ultima modifica di Pihippo : 08-06-2010 alle 00:33. |
|
|
|
|
|
#918 | |
|
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24170
|
Quote:
Clicca qui... Naturalmente questo non significa che saranno disponibili per la vendita in quella data, dato che sono previsti nel 2011...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
|
|
|
|
|
#919 | |
|
Senior Member
Iscritto dal: Apr 2005
Messaggi: 2905
|
Quote:
Il sandy bridge di fascia alta, credo su socket 2011... Avrà 8 core con HT. Per questo mi suona strano che AMD pensi di concorrere con intel con soli 4 moduli, 4 FPU e 8 INT. Alla fine: al momento nel die di phuban ci sono stati 6 int e 6 fpu. BD sarà a 32nm, quindi un buon 30% in meno, il che vuol dire che un thuban portato a 32nm avrebbe un diesize del 49% di quello che ha attualmente. Praticamente a 32nm possono starci, nella stessa rea, due thuban. Volete dirmi che loro riescono a farci stare solo 8 int (un 33% in più di thuban) e 4 FPU? (il 33% in meno=??) Saranno anche più grandi queste FPU... ma caspita... Consideriamo anche un die grande come quello di deneb, il 33% in meno di quello di thuban, che forse è fin troppo largo: portiamo deneb a 32nm e quello già occupa la metà dell'area. A questo punto per ogni INT aggiunta ci va via il 5% dell'area. Se aggiungiamo 4 int (deneb è quad core), l'area aumenta del 20%. Il 20% di una rea grande il 50% dell'attuale. Quindi siamo ad un core 8int e 4 fpu che occupa il 60% dell'area di deneb. C'è da considerare l'aumento di dimensione della cache, che in deneb porta via un sacco di spazio... Ma secondo me ci sta più materiale in quel chip! E contro intel sarebbe numericamente svantaggiato... perché intel venderà comunque 8 int, come AMD, ma anche 8 fpu. Anche che quelle AMD siano il doppio più potenti (pare sia il doppio più potente di quelle attuali) e che quelle di intel non migliorino passando da nehalem a SB... Non ci sarebbe comunque un gran confronto! Al più al più sarebbero pari! Intel avrebbe comunque il multi-threading... Diverso chiaro, se AMD implementasse 8 moduli. Allora avrebbe 8 fpu come intel. Ma mentre intel raddoppia i thread per core, amd raddoppia tutta la int... E quindi 16 int contro 8 multi threaded... Ora io non voglio fare dell'ottimismo sfrenato e pensare che ci stanno fregando dicendoci che ci sono meno core di quelli che ci sono in realtà... Però mi sembra che abiano la possibilità di metter su più carne di quella che ci dicono... Consideriamo anche che con HKMG il chip consumerà meno... vuol dire che: - o possiamo fare chip più grandi - o possiamo salire di più con la frequenza Ma la frequenza che raggiungiamo dipende molto dalla lunghezza delle pipeline, che come abbiamo visto con netbuirst alal fine non conviene allungare più di tanto... Già Deneb/thuban mi sembra abbiano pipeline piuttosto lunghe...più di nehalem. E con le lunghezze di pipeline cui si sono assestate le architetture attuali alla fine più di 4GHz non si sale... Altrimenti il calore cresce molto più delle prestazioni e alla fine la soluzione non è efficiente. Molto meglio ingrandire il die insomma...
__________________
acquistato con soddisfazione da: SHIVA>>LuR<< Jokerpunzk,Markenforcer,vkbms, campioni del mondo,mstella. Venduto a: maxVi, gabrieletor, banaz, tdm70, raxxo, frantheman |
|
|
|
|
|
#920 | |
|
Member
Iscritto dal: Nov 2009
Messaggi: 78
|
Quote:
confondevo con i problemi di alias sugli indirizzi. E' una LRU perchè è a due vie e basta un bit (per linea) per puntare alla via la cui linea deve essere sfrattata. Mi pare che intel adotti un pseudo lru che con 2 bit indirizza più vie, ma non so nulla dei processori recenti.
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 13:45.











ti riferisci alla tag per l'indirizzo fisico? può essere, nel senso che fa i suoi look up alle tag ram (una per via) nel tempo di un ciclo per la decodifica dell'indirizzo. 
confondevo con i problemi di alias sugli indirizzi. E' una LRU perchè è a due vie e basta un bit (per linea) per puntare alla via la cui linea deve essere sfrattata. Mi pare che intel adotti un pseudo lru che con 2 bit indirizza più vie, ma non so nulla dei processori recenti.








