Apple A9X, svelati i segreti: è un dual-core con GPU da 12 cluster

Apple A9X, svelati i segreti: è un dual-core con GPU da 12 cluster

Chipworks ha realizzato il teardown della CPU di iPad Pro, Apple A9X. All'interno del SoC troviamo una CPU dual-core con una GPU a 12 cluster

di pubblicata il , alle 12:31 nel canale Apple
AppleiPad
 
26 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
MiKeLezZ01 Dicembre 2015, 15:45 #11
Originariamente inviato da: acerbo
e certo che ce vole, copia incolla e invia alla stampante 3D ...
No: copia incolla e invia alla fabbrica litografica a 16nm FinFET, in questo caso TSMC Limited.
RaZoR9301 Dicembre 2015, 15:57 #12
Originariamente inviato da: MiKeLezZ
E' un classico chippetino per far andare alla grande i giochetti e consumare poco... Gli ampi margini di miglioramento sinceramente non li vedo, visto che è un A9 sotto steroidi.

Il paragone con Intel è poco rappresentativo: certamente ora come ora l'A9X nel settore mobile batte qualsiasi offerta Intel... ma nel settore desktop vi è ancora il predominio x86 e un ARM si trova in difficoltà anche nei task più comuni. Inoltre con l'uscita di Skylake Mobile il divario sarà nuovamente riappianato.

E stiamo comunque parlando di proprietà intellettuali ARM e Imagination Technologies, di Apple c'è ben poco.
Più che ovvio che si tratti di una variante dell'A9, dal momento che è sempre stato così per i SoC tablet di Apple. Dal punto di vista architetturale parliamo di un ~ +30% di IPC rispetto ai core dell'A8. Questo poco ci dice sulle potenziali performance dell'A10X, ma considerando che per l'A10 sarà disponibile un processo produttivo più raffinato (versione "non shrink" dei 16FinFET+ di TSMC) e packaging (inFO), ci si può facilmente aspettare un incremento prestazionale a doppia cifra; questo senza considerare potenziali cambiamenti architetturali (direi alquanto probabili, come sempre).

Per il resto il tuo post è abbastanza confuso, non è infatti chiaro cosa abbia a che fare il settore desktop, con CPU da 40/60+W, con un SoC da ~5W. Quello che è importante sono le performance per W, dove potremmo essere vicini a Skylake. In aggiunta a queste sarebbe interessante conoscere la scalabilità dell'attuale architettura usata da Apple; non credo che scalare fino ai 15W per gli ultrabook sia fuori questione, ad esempio raddoppiando i core e passando a 16 o più cluster per la GPU.

Infine, i Core A57 e A72 sono ben diversi dai core "Twister" di Apple, la cui architettura è ormai piuttosto differente da quella reference di ARM Holdings. Se fosse tutto così semplice come lasci intendere non è chiaro perché nessuno abbia sviluppato SoC altrettanto grandi (in termini di mm^2) e altrettanto performanti (in termini CPU/GPU/bandwidth) nel mondo ARM.
pingalep01 Dicembre 2015, 17:10 #13
se penso a quanto si svalutano i device e quanto aumentano le potenze delle apu nel mondo mobile e tablet arm in confronto al mondo desktop mi viene da piangere. dal 2007 ad oggi a pari prezzo la potenza è al massimo raddoppiata in ambito pc.
unica cosa figa in ambito desktop è che a pari potenza di una buona cpu del 2008 da 90w e 150 euro adesso ci compri un nuc da 10w con gpu integrata, e fanless, per la stessa cifra. quindi grandissimi migliroamenti in efficienza!
devil_mcry01 Dicembre 2015, 19:07 #14
Originariamente inviato da: pingalep
se penso a quanto si svalutano i device e quanto aumentano le potenze delle apu nel mondo mobile e tablet arm in confronto al mondo desktop mi viene da piangere. dal 2007 ad oggi a pari prezzo la potenza è al massimo raddoppiata in ambito pc.
unica cosa figa in ambito desktop è che a pari potenza di una buona cpu del 2008 da 90w e 150 euro adesso ci compri un nuc da 10w con gpu integrata, e fanless, per la stessa cifra. quindi grandissimi migliroamenti in efficienza!


E' vero ma vai a vedere cosa è successo tra il 97 e il 2006 circa in ambito PC

Sono passati dai Pentium MMX a 150MHz ai Core 2 DUO passando da meno di 24 Megaflops a circa 2000 Megaflops (2 GigaFlops) nelle prime versioni. Inoltre anche li, se vedi l'evoluzione delle FPU etc, una CPU moderna, ad esempio il mio i7, è in grado di generare circa 200 GigaFlops di picco in AVX2 10 volte circa cosa era possibile ottenere 6-7 anni fa.

Il discorso è relativo a tanti aspetti, in primo luogo ARM ha goduto in tempi recenti di PP sempre più evoluti che erano già in cantiere a fine decennio scorso, inoltre sono partiti da una architettura molto poco prestante, su cui c'erano pochi stimoli, con clock molto bassi e hanno potuto investirci sopra alla grande.

Per dirti di più, il Cortex A8, che trovavi sui telefoni del 2010, era basato ancora su una architettura in-order. Se guardi Intel quando ha presentato Bay Trail in sostituzione di Bonnel (architettura out of order vs in order) ha più che raddoppiato le prestazioni per colpo di clock, andando vicino in molti casi al +200% di IPC (dovuto anche ad altri fattori).
cdimauro01 Dicembre 2015, 19:39 #15
Originariamente inviato da: sslazio
praticamente è meglio l'A8X

No, questo è molto meglio: due core anziché tre, e prestazioni nettamente migliori su singolo core.
Originariamente inviato da: gpat
Andando a vedere i benchmark, e considerando che ci sono ancora ampi margini di miglioramento, questo chippetto fa veramente paura.
Con un paio di revisioni rischiano di mettere nel sacco Intel, Macbook, Surface, convertibili vari, tutti insieme, zitti zitti.

Ma anche no: Tested: Why the iPad Pro really isn't as fast a laptop. Articolo lungo (3 pagine: non saltate le altre due dopo aver letto la prima) e tecnico, ma che vale la pena leggere.

Mentre dall'articolo di Anandtech riporto qualche altro dato interessante:

"Finally, it's also worth noting just how large A9X is compared to other high performance processors. Intel's latest-generation Skylake processors measure in at ~99mm2 for the 2 core GT2 configuration (Skylake-Y 2+2), and even the 4 core desktop GT2 configuration (Intel Skylake-K 4+2) is only 122mm2. So A9X is larger than either of these CPU cores, though admittedly as a whole SoC A9X contains a number of functional units either not present on Skylake or on Skylake's Platform Controller Hub (PCH). Still, this is the first time that we've seen an Apple launch a tablet SoC larger than an Intel 4 core desktop CPU."

Da qualche parte avevo letto alcune riflessioni sul fatto che l'architettura è già molto pompata, col fatto che sia in grado di decodificare ed eseguire ben 6 istruzioni per ciclo di clock, ma al momento non sono riuscito a recuperare l'articolo.
Originariamente inviato da: floc
diranno che ha 12 core e tutti applaudiranno, quando ad amd per molto meno stanno facendo causa

Non c'entra, per due motivi: si tratta di 12 core della GPU, e sono core completi.
Originariamente inviato da: acerbo
un chip custom che serve per essere usato su un dispositivo che é di fatto un display, quindi grafica-grafica-grafica e ancora grafica ... perché dovrebbe essere sbilanciato? a Me sembra la scelta piu' razionale, non é mica un PC che ha bisogno di 8 core lato cpu per parallelizzare i processi in background.

Forse ti stai confondendo con Android: in generale, i PC non hanno bisogno di zilioni di core. Ovviamente poi dipende sempre da quello che devi farci.
Originariamente inviato da: RaZoR93
Più che ovvio che si tratti di una variante dell'A9, dal momento che è sempre stato così per i SoC tablet di Apple. Dal punto di vista architetturale parliamo di un ~ +30% di IPC rispetto ai core dell'A8. Questo poco ci dice sulle potenziali performance dell'A10X, ma considerando che per l'A10 sarà disponibile un processo produttivo più raffinato (versione "non shrink" dei 16FinFET+ di TSMC) e packaging (inFO), ci si può facilmente aspettare un incremento prestazionale a doppia cifra;

La dimensione dei transistor non è certo il doppio.
questo senza considerare potenziali cambiamenti architetturali (direi alquanto probabili, come sempre).

Vedi sopra.
Per il resto il tuo post è abbastanza confuso, non è infatti chiaro cosa abbia a che fare il settore desktop, con CPU da 40/60+W, con un SoC da ~5W. Quello che è importante sono le performance per W,

Concordo.
dove potremmo essere vicini a Skylake.

Vedremo quando arriveranno le soluzioni mobile di quest'architettura.
In aggiunta a queste sarebbe interessante conoscere la scalabilità dell'attuale architettura usata da Apple; non credo che scalare fino ai 15W per gli ultrabook sia fuori questione, ad esempio raddoppiando i core e passando a 16 o più cluster per la GPU.

E' la sola strada che consenta aumenti prestazionali consistenti, perché quelli architetturali saranno sempre più limitati. L'A9X è già un'architettura molto "tirata".
Infine, i Core A57 e A72 sono ben diversi dai core "Twister" di Apple, la cui architettura è ormai piuttosto differente da quella reference di ARM Holdings. Se fosse tutto così semplice come lasci intendere non è chiaro perché nessuno abbia sviluppato SoC altrettanto grandi (in termini di mm^2) e altrettanto performanti (in termini CPU/GPU/bandwidth) nel mondo ARM.

Concordo.
RaZoR9301 Dicembre 2015, 19:51 #16
Originariamente inviato da: cdimauro
La dimensione dei transistor non è certo il doppio.

Vedi sopra.
Scusami, non credo di aver capito cosa intendi dire.

Originariamente inviato da: cdimauro
E' la sola strada che consenta aumenti prestazionali consistenti, perché quelli architetturali saranno sempre più limitati. L'A9X è già un'architettura molto "tirata".
Possibile, però questo discorso si è già sentito in passato, in particolare per i "modesti" miglioramenti dell'A8. Io credo che ci sia molto più margine di manovra di quanto non si pensi, e mi chiedo quando Apple implementerà il SMT nella propria architettura. Questo detto, una parte significativa degli incrementi prestazionali saranno dovuti ai progressi del processo produttivo. Per il 2016 ci saranno significativi miglioramenti per TSMC e nel 2017, se tutto va bene, i 10 nm dovrebbero finalmente portare ad un consistente (~2x) incremento della densità, che è ferma dai 20nm planari. Nel complesso credo sia lecito aspettarsi una progressione a doppia cifra almeno fino al 2018, limitazioni del design permettendo.
cdimauro01 Dicembre 2015, 21:36 #17
Originariamente inviato da: RaZoR93
Scusami, non credo di aver capito cosa intendi dire.

Pardon. Mi rendo conto di non essere stato chiaro. Questa volta i troppi quote hanno creato confusione, dati i diversi temi.

Nello specifico, mi riallacciavo al fatto che l'architettura fosse già molto tirata.

Nel frattempo ho recuperato la pagina, della recensione dell'ultimo iPhone da parte del solito AnandTech, in cui si analizzava il SoC:

[I]"A7 brought with it Cyclone, a CPU that was not only 64-bit, but thanks to its exceptional (for a mobile CPU) issue width of 6 micro-ops, brought with it a huge jump in single-threaded performance.
[...]
What that gives Apple then is a chance to push the envelope much harder on clockspeeds, taking their already wide CPU designs and turning up the clockspeeds as well."[/I]

D'altra parte RISC out-of-order in grado di (decodificare ed) eseguire 6 istruzioni per ciclo di clock non è che se ne vedano in giro tanti, a causa dell'elevata complessità di progettazione.
Possibile, però questo discorso si è già sentito in passato, in particolare per i "modesti" miglioramenti dell'A8. Io credo che ci sia molto più margine di manovra di quanto non si pensi,

Agendo sulle solite cose: dimensioni delle cache, della branch cache, delle entry nei TLB, ecc., ovviamente in accordo ai transistor disponibili e al power-budget.

Stravolgimenti di altro tipo alla microarchitettura, già solida e performante, difficilmente sarà difficile vederne.
e mi chiedo quando Apple implementerà il SMT nella propria architettura.

In effetti i core sono abbastanza "cicciottelli", ma evidentemente non hanno ancora pensato a questa possibilità grazie ai significativi incrementi prestazionali che hanno ottenuto finora.
Questo detto, una parte significativa degli incrementi prestazionali saranno dovuti ai progressi del processo produttivo. Per il 2016 ci saranno significativi miglioramenti per TSMC e nel 2017, se tutto va bene, i 10 nm dovrebbero finalmente portare ad un consistente (~2x) incremento della densità, che è ferma dai 20nm planari. Nel complesso credo sia lecito aspettarsi una progressione a doppia cifra almeno fino al 2018, limitazioni del design permettendo.

Vantaggi di questo tipo arriveranno coi 10nm, e solo se le rese saranno consistenti. Il che, con tutti i problemi degli ultimi tempi, è un terno al lotto...
MiKeLezZ02 Dicembre 2015, 02:49 #18
Originariamente inviato da: RaZoR93
Più che ovvio che si tratti di una variante dell'A9, dal momento che è sempre stato così per i SoC tablet di Apple. Dal punto di vista architetturale parliamo di un ~ +30% di IPC rispetto ai core dell'A8.
Dal A8 al A9 hanno aumentato la frequenza del 40% :| hanno aumentato la L2 del 300% :| ed è pure diminuita la nanometria! Se le prestazioni non fossero aumentate mi sarei anche preoccupato, eh.

Per il resto il tuo post è abbastanza confuso, non è infatti chiaro cosa abbia a che fare il settore desktop, con CPU da 40/60+W, con un SoC da ~5W.
Apple con il suo design di CPU parla di "desktop class processor"! (y)

Quello che è importante sono le performance per W, dove potremmo essere vicini a Skylake.
Ok, quello che volevo dire è questo: col GeekBench potremmo anche vedere che un ARM eguaglia un x86... posso benissimo capire che l'architettura ARM sia anche più efficiente (in taluni task, quantomeno) della x86... Ma facciamo partire un SPEC CPU 2006 su A9X e il CORE M7 e vedrai come tutto il castello di sabbia si sgretola.
Fino a che siamo in un ambiente isolato come iOS è un discorso, ma se vogliamo veramente proporre una CPU "desktop class" dobbiamo anche usare applicativi adeguati (non candy crush e imovie).

In aggiunta a queste sarebbe interessante conoscere la scalabilità dell'attuale architettura usata da Apple; non credo che scalare fino ai 15W per gli ultrabook sia fuori questione, ad esempio raddoppiando i core e passando a 16 o più cluster per la GPU.
Un po' per la serie del "se mio nonno aveva le ruote"... Tanto da 150mm2 a 250mm2 che sarà mai, giusto? Già ora li staranno sfornando col contagocce e son stati costretti a tagliare la L3 per non creare un panettone... per poi farci girare cosa?
Vogliamo mica tornare all'era dei PowerPC? Ve li ricordate?

Infine, i Core A57 e A72 sono ben diversi dai core "Twister" di Apple, la cui architettura è ormai piuttosto differente da quella reference di ARM Holdings.
E' vero, ma non è che abbiano creato qualcosa di nuovo... hanno solo ottimizzato un progetto già esistente, più o meno raddoppiando dove potevano.

Se fosse tutto così semplice come lasci intendere non è chiaro perché nessuno abbia sviluppato SoC altrettanto grandi (in termini di mm^2) e altrettanto performanti (in termini CPU/GPU/bandwidth) nel mondo ARM.
A parte che tutti i più grandi player (ovvero Qualcomm, Samsung, NVIDIA, MediaTek) sviluppano di fatto modifiche più o meno estese dei reference ARM (es. configurazione dei core, aggiunta di coprocessori, integrazione della baseband)... in ambito economico la prima domanda dovrebbe sempre essere: "che ci guadagnano?".
Prima di tutto dovrebbero avere una richiesta dal mercato. Nessuno (es. LG, Samsung, Lenovo) richiede tale performante processore perché non vi sono applicativi tali da richiederlo e i probabili acquirenti, ovvero chi misura i benchmark e compra il device più veloce, è un numero trascurabile affinché l'investimento rientri.
La creazione di un SoC da 150mm2 a 16nm richiede inoltre un investimento colossale ovvero un rischio imprenditoriale che aziende come le sopracitate non sono abituate a prendere (loro basano il loro mercato sui volumi di vendita e quindi preferiscono oggetti a basso costo e con alta rotazione).

Apple ha invece molteplici interessi:
1) Si slega da un futuro probabile fornitore (Intel, che già equipaggia i suoi laptop e desktop) e quindi ottiene minori costi per la fornitura di materiale dei suoi prossimi prodotti
2) Mantiene una leadership tecnologica e quindi alto il valore e la richiesta delle proprie azioni
3) Consolida la partnership ovvero offre un notevole apporto di denaro a quello che diventerà il proprio unico fornitore (TSMC)... che a sua volta reinvestirà in avanzamenti tecnologici di cui potrà nuovamente servirsene
4) Crea un nuovo bisogno nei consumatori ovvero "il tablet che è come un pc, anche se non lo è al 100%, ma ve ne accorgerete tardi" (poiché legato all'ecosistema iOS in cui ancora mancano applicazioni desktop), un rischio di impresa che se va bene può continuare a fruttargli esponenzialmente per il prossimo decennio, in stile iPhone
5) Amplia la sua offerta con un prodotto a metà fra il tablet e il laptop e allo stesso tempo si contrappone all'offerta Microsoft Surface
cdimauro02 Dicembre 2015, 07:16 #19
Originariamente inviato da: MiKeLezZ
Ok, quello che volevo dire è questo: col GeekBench potremmo anche vedere che un ARM eguaglia un x86... posso benissimo capire che l'architettura ARM sia anche più efficiente (in taluni task, quantomeno) della x86... Ma facciamo partire un SPEC CPU 2006 su A9X e il CORE M7 e vedrai come tutto il castello di sabbia si sgretola.
Fino a che siamo in un ambiente isolato come iOS è un discorso, ma se vogliamo veramente proporre una CPU "desktop class" dobbiamo anche usare applicativi adeguati (non candy crush e imovie).

Infatti. E' meglio lasciar perdere benchmark sintetici come Geekbench, e usare applicazioni reali o benchmark che cercano di simulare un carico reale, com'è sviscerato nell'articolo di cui ho riportato il link, per vedere cosa succede in uno scenario usuale/normale.
E' vero, ma non è che abbiano creato qualcosa di nuovo... hanno solo ottimizzato un progetto già esistente, più o meno raddoppiando dove potevano.

No, non c'è mai stato nulla di paragonabile al progetto di Apple, nemmeno da parte di ARM.

Soltanto nVidia ha proposto un progetto molto innovativo, anche se in realtà non è un ARM, ma un'architettura VLIW proprietaria che tramite soft decoder è in grado di eseguire codice ARM.
PaulGuru02 Dicembre 2015, 11:46 #20
Originariamente inviato da: gpat
Andando a vedere i benchmark, e considerando che ci sono ancora ampi margini di miglioramento, questo chippetto fa veramente paura.
Con un paio di revisioni rischiano di mettere nel sacco Intel, Macbook, Surface, convertibili vari, tutti insieme, zitti zitti.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^