|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75173
|
Link alla notizia: http://www.hwupgrade.it/news/cpu/sin...tom_44257.html
L'utilizzo di processori Atom in sistemi server di elevata densità e ridotto consumo alla base della futura evoluzione di queste CPU, destinate a venir proposte anche in versioni a 8 core Click sul link per visualizzare la notizia. |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Feb 2009
Città: Forlì
Messaggi: 3688
|
Presto nei vostri smartphone!
![]() |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Sep 2001
Città: Saronno (VA)
Messaggi: 21741
|
Otto core? Mi pare un perfetto controsenso in un Atom.
Che me ne faccio? Mica devo fare rendering. Allora piuttosto fanne due più potenti e con clock variabile. |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Dec 2004
Città: Roma
Messaggi: 27168
|
non ho capito cosa significhi "Cpu di tipo out of order"...
__________________
MetallicGear Qube,Asus Strix z690 d4,i7 13700k+Arctic 360rgb,2x32gb Patriot Viper Rgb 3600mhz,ssd:980pro 2TB-970evo 1tb-970evo 2tb-sm941 2tb-kingston 3dUltra 2tb,4090 phantom+Samsung 34 g8 OLED,Corsair 1000w,Xonar U7mk2 USB,sua 1500i,Asus Scope TKL-g13-g35-g903 vecchi bench 780/970 |
![]() |
![]() |
![]() |
#5 | |
Senior Member
Iscritto dal: May 2004
Messaggi: 7495
|
Quote:
Questo soc arm serve per contrastare il futuro utilizzo di soc arm in micro server di questa categoria che anche loro saranno simili come numero di core che contenuto di porte direttamente nel soc. Ultima modifica di coschizza : 18-10-2012 alle 08:01. |
|
![]() |
![]() |
![]() |
#6 | |
Senior Member
Iscritto dal: May 2004
Messaggi: 7495
|
Quote:
|
|
![]() |
![]() |
![]() |
#7 | |
Senior Member
Iscritto dal: Jan 2010
Città: Milan
Messaggi: 9802
|
Quote:
intanto la discriminante per questi nuovi atom sarà -come sempre- il prezzo.. anzi, oggi più che mai intel non si può più permettere di imporre prezzi da fuori di testa, visto che un pochino la crisi si fa sentire anche nei loro bilanci.. |
|
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Oct 2008
Messaggi: 10340
|
Quote:
![]() Un webserver non ha bisogno di potenza bruta ad esempio, si potrebbero fare cluster che consumano pochissimo con nodi da accendere solo quando ci sono picchi. Ma ci sono tanti altri servizi che non necessitano di chissà quanta potenza e già girano su atom...
__________________
Le mie 80+ Trattative del Mercatino Vendo: Case Koolink midtower con pannelli fonoassorbenti |
|
![]() |
![]() |
![]() |
#9 | |
Senior Member
Iscritto dal: Apr 2008
Città: Torre storta
Messaggi: 1249
|
Quote:
![]() Appena vedo scritto ATOM però risvegliano brutti ricordi... ![]()
__________________
Mi piacerebbe sapere chi è il mandante di tutte le cazzate che faccio!!! ![]() |
|
![]() |
![]() |
![]() |
#10 |
Senior Member
Iscritto dal: May 2004
Messaggi: 7495
|
Se qualcuno si chiedesse che server usaranno questo tipo di soc la risposta potrebeb sembrare ironica perche fra i tanti vi è uno leader del mercato che è stato comprato da AMD.
vi riporto al loro sito con un prodotto preso come esempio che monta svariete centinaia di soc arm attuali e che saranno espansi con questi modelli in futuro per raggiungere quindi anche le migliaia di core tutti in un singolo rack. http://www.seamicro.com/node/212 Ultima modifica di coschizza : 18-10-2012 alle 08:37. |
![]() |
![]() |
![]() |
#11 | |
Senior Member
Iscritto dal: Dec 2004
Città: Roma
Messaggi: 27168
|
Quote:
che senso ha ribadire il concetto?
__________________
MetallicGear Qube,Asus Strix z690 d4,i7 13700k+Arctic 360rgb,2x32gb Patriot Viper Rgb 3600mhz,ssd:980pro 2TB-970evo 1tb-970evo 2tb-sm941 2tb-kingston 3dUltra 2tb,4090 phantom+Samsung 34 g8 OLED,Corsair 1000w,Xonar U7mk2 USB,sua 1500i,Asus Scope TKL-g13-g35-g903 vecchi bench 780/970 |
|
![]() |
![]() |
![]() |
#12 | |
Senior Member
Iscritto dal: May 2004
Messaggi: 7495
|
Quote:
Dipende dall'utilizzo che ne fai e questo vale per utte le cpu in circolazione anche quelle ibm spark ecc sono state in order in varie generazioni dipende dallo scopo finale dal tipo di prestaioni e consumi che devi raggiungere. Ti faccio un esempio la xbox 360 ha una cpu ibm cor 3 core in order farli out of order singificava occupare piu spazio e a parità di die avresti avuto solo 2 core ma piu performanti, visto l'utilizzo è stata scelta la prima soluzione. Un altro esempio le cpu oracle/sun SPARC sono state sempre in order dino al 2011 con la SPARC T4 la prima out of order. Ultima modifica di coschizza : 18-10-2012 alle 11:13. |
|
![]() |
![]() |
![]() |
#13 |
Member
Iscritto dal: Jul 2005
Messaggi: 210
|
@illidan2000
che atom e un dei pochi se non l'unica cpu moderna che non segue il principio out-of-order |
![]() |
![]() |
![]() |
#14 |
Senior Member
Iscritto dal: May 2004
Messaggi: 7495
|
|
![]() |
![]() |
![]() |
#15 |
Member
Iscritto dal: Sep 2007
Città: Larciano (Pistoia)
Messaggi: 150
|
bah,
É da un mesetto che ho sostituito il mio "vecchio" debian server con atom dual core 330 (d945gclf2 2gb ram) con una nuova fiammante odroid-x con processore ARM7L (stesso SoC del galaxy s3) quad core con 1gb ram sul quale gira debian 7 wheezy con kernel 3.6.2 (finalmente ottimo supporto). Per le funzioni che deve fare (videosorveglianza, server samba, torrentserver, webserver) non mi fa per niente rimpiangere l'atom. anzi, prima il consumo stava sui 45/55W, ora oscillo tra 6/10W. Quando verrá inserito nel kernel anche il supporto allo scaling di frequenza per cpu,gpu,ram sará ancora meglio. per ora cmq non mi lamento.... anzi! ciao ciao atom! |
![]() |
![]() |
![]() |
#16 | |
Senior Member
Iscritto dal: May 2004
Messaggi: 7495
|
Quote:
Quindi per il tuo utilizzo ti servirebbero gli ultimi soc atom che hanno un tdp confrontabile con il sistema che hai usato tu. Ultima modifica di coschizza : 18-10-2012 alle 13:29. |
|
![]() |
![]() |
![]() |
#17 | |
Senior Member
Iscritto dal: Apr 2003
Città: Genova
Messaggi: 4741
|
Quote:
si dice che agli anni 70 risalgono i primi studi sull' esecuzione out of order delle istruzioni, a livello accademico... ma prima di avere processori OoOE funzionanti, anche già nel settore mainframe e delle workstation RISC (dove la maggiore regolarità e semplicità della ISA - e quindi della pipeline della cpu - favoriva l' applicazione di tecniche implementative più sofisticate - o dove l' esigenza di prestazioni assolute "a qualunque costo", la richiedeva) c'è voluto un certo tempo ancor più per vedere i primi processori out of order di fascia mainstream nonchè CISC come cyrix 6x86, pentium pro, amd k6, tutti della metà degli anni 90.. il fatto è che passare da un' architettura in order a una out of order non è un' operazione immediata la prima è sequenziale e sincrona - ogni istruzione è eseguita (*) se e solo se è completata l' esecuzione di quella che la precede nel programma, il che vuol dire che ad ogni operazione in memoria la pipeline si ferma (per parecchi nanosecondi, corrispondenti a parecchi cicli di clock in cui la cpu avrebbe potuto eseguire altro) in attesa del dato è facile vedere come in questo caso (magari con un processore basato su una isa complessa, che per dire preveda un forte uso dello stack per via della carenza di registri...) sia più problematica e possiiblmente meno efficace l' implementazione di un eventuale parallelismo hw - per sfruttare il quale in maniera ottimale occorrerebbe poter lavorare sempre su coppie (o n-uple) di operazioni non dipendenti tra loro (cioè il risultato della prima richiesto dalla seconda), e con il meno possibile di accessi in memoria ... ora, la seconda richiede di ripensare la pipeline in ottica dataflow - le istruzioni sono caricate in ordine di programma, eseguite se e quando sono disponibili gli operandi (in maniera asincrona), e infine "ritirate" (finalizzate, con risultati salvati nei registri, o in certi casi scartate - se una condizione da cui dipendeva il branch in cui ricadono si rivela poi falsa ) di nuovo in ordine di programma cosa che serve a mantenere la correttezza nell' esecuzione dello stesso (che non è più implicitamente assicurata come nel caso precedente) e per cui nel caso della OOOE occorre logica (quindi transistor) per il tracciamento e riordino dopo l' esecuzione oltre alla logica e alle strutture dati (complesse) necessarie per bufferizzare a monte delle alu, una "instruction window" più o meno ampia, sbrogliare le dipendenze all' interno di questo, tenere registri interni in soprannumero e tracciare quelli rinominati (magari anche disaccoppiarli ad esempio in modo che il set visibile all' istruzione/operazione attuale sia separato dal set globale, e in questo copiato solo al momento della finalizzazione) accodare (altrimenti si rischiano stalli con perdita di efficienza) le operazioni collaterali risultanti dall' esecuzione ... tutti dettagli che contribuiscono in positivo alla complessità architetturale e alla quantità di transistor da integrare che per certe applicazioni e/o in certe condizioni (ad esempio, se so che il codice che verrà eseguito ha una elevata regolarità, o non sono determinanti le prestazioni pure ma piuttosto il restare entro un certo budget energetico) si può scegliere di non implementare - anche se siamo nel 2012..
__________________
Jappilas is a character created by a friend for his own comic - I feel honored he allowed me to bear his name Saber's true name belongs to myth - a Heroic Soul out of legends, fighting in our time to fullfill her only wish Let her image remind of her story, and of the emotions that flew from my heart when i assisted to her Fate
Ultima modifica di jappilas : 18-10-2012 alle 22:21. |
|
![]() |
![]() |
![]() |
#18 |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3569
|
I transistor usati per l'esecuzione OoO sono facilmente rimpiazzabili da compilatori ottimizzati. Ecco perché le console non hanno unità OoO. L'HW è noto, il flusso del programma pure, e quindi il compilatore può eseguire le stesse ottimizzazioni che farebbe l'HW al momento dell'esecuzione, ordinando le istruzioni in maniera efficiente.
L'OoO HW serve per garantire la libertà di implementazione dell'architettura, così che su una architettura la sequenza è ordinata al volo in una maniera e su un altra in maniera diversa, in entrambi i casi tentando di massimizzare il throughput. Inoltre l'OoO vale su architetture con pipeline lunghe, là dove attendere l'esecuzione completa richiede molti cicli di clock. Su pipeline corte è possibile che lo spreco dei transistor per ottenere l'esecuzione OoO non valga la pena, e anzi sia meglio fare una pipeline parallela che può eseguire in maniera autonoma altro codice non dipendente da quello in esecuzione sulla prima. In alcuni contesti, conoscere esattamente i tempi di esecuzione di una operazione è importante, per cui molti microcontrollori mantengono l'esecuzione in order. A seconda delle architetture e dei campi di utilizzo un approccio è migliore di un altro. |
![]() |
![]() |
![]() |
#19 | ||||||||
Senior Member
Iscritto dal: Apr 2003
Città: Genova
Messaggi: 4741
|
Quote:
l' esecuzione fuori ordine è fatta per massimizzare lo sfruttamento delle risorse di calcolo (rifornirle continuamente di dati da elaborare) in presenza di accessi in memoria/IO (che altrimenti bloccherebbero una pipeline sequenziale) e dei fattori da cui dipende l' esecuzione in ogni dato momento, tipicamente noti non al momento di compilare il programma, nè di installarlo, ma all' ultimo durante l' esecuzione... e lì il compilatore non ha modo di arrivare e adottare accorgimenti (a meno non sia un jit, ma un jit ha un certo overhead), così come ben difficilmente da solo può mitigare l' effetto di un accesso in memoria con annessa latenza... Quote:
Quote:
Quote:
per cui la covenienza di applicare ottimizzazioni statiche a priori, si ha comunque... riprendo un esempio dall' altro thread: Core e Core 2 sono (micro)architetture della stessa famiglia con parecchie similarità, entrambe dotate di esecuzione fuori ordine eppure, siccome il primo è dotato di un decoder derivato dal P6, superscalare a 3 vie ma capace di decodificare 3 istruzioni in una passata a patto che siano tutte e tre semplici -traducibili in una sola microop- o una complessa -traducibile in una serie di fino a 4 microop- seguita da due semplici, mentre nel secondo il decoder è a 4 vie ma soggetto a una limitazione analoga far eseguire a ciascuna il codice ottimizzato per l' altra produce una situazione subottimale (cicli in cui si decodifica un' istruzione alla volta finchè quella complessa è allineata al complex decoder) Quote:
tra i non x86, DEC Alpha 21264 funzionante da 500 Mhz (per l' epoca una frequenza elevatissima) a un ghz, aveva una pipleline ooo a 7 stadi il numero di stadi dipende dalla strutturazione della pipeline (a sua volta dipendente dalla ISA e dall' approccio scelto per implementarla) in funzione della frequenza target (dal momento che la pipeline può lavorare alla frequenza raggiungibile dallo stadio più lento, spezzare stadi complessi in stadi più semplici può permettere di salire in frequenza) ma da solo non c' entra nulla con l' usare o meno l' esecuzione in order piuttosto che ooo... Quote:
avrai notato che dopo un iniziale entusiasmo, di itanium (o di processori vliw in genere) non si sente più parlare... il motivo è che nonostante le promesse di elevate prestazioni, si è notato che lo sforzo richiesto al programmatore per ottenerle (analizzare le dipendenze tra istruzioni e scriverle a coppie nei bundle , a mano..) era troppo elevato, e solo pochi avevano effettivamente le competenze e le capacità per farlo in modo che il codice girasse su itanium con prestazioni superiori a quanto ottenibile in meno tempo e con tool standard, su processori general purpose il gioco non valeva la candela... a maggior ragione se poi i processori general purpose nel frattempo migliorano al punto da surclassare gli itanium in sostanzialmente tutti i campi che questo domina... Quote:
ma in primis si lavora sul sw stesso di modo da dargli un comportamento il più deterministico possibile, cominciando col scegliere un kernel realtime dalle latenze documentate (che quand' anche lo sono sono sempre documentate al più nel worst case) e proseguendo con l' eliminazione alla radice del page swap in memoria virtuale, e magari delle malloc() quindi anche per quanto riguarda le latenze hw, interessa più che siano magari elevate ma costanti (quindi prevedibili) che non che siano ridotte in senso assoluto ma i microcontrollori mantengono l' esecuzione in order più che altro per essere semplici ed economici da produrre e integrare, più che per ridurre le latenze - che con esecuzione in order in effetti aumentano, dovendo fare i conti con accessi in memoria non mascherati, di cui attendere il completamento prima di andare avanti con il programma... Quote:
__________________
Jappilas is a character created by a friend for his own comic - I feel honored he allowed me to bear his name Saber's true name belongs to myth - a Heroic Soul out of legends, fighting in our time to fullfill her only wish Let her image remind of her story, and of the emotions that flew from my heart when i assisted to her Fate
Ultima modifica di jappilas : 19-10-2012 alle 02:22. |
||||||||
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 19:17.