Apple A9X, svelati i segreti: è un dual-core con GPU da 12 cluster

Chipworks ha realizzato il teardown della CPU di iPad Pro, Apple A9X. All'interno del SoC troviamo una CPU dual-core con una GPU a 12 cluster
di Nino Grasso pubblicata il 01 Dicembre 2015, alle 12:31 nel canale AppleAppleiPad
26 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoIl paragone con Intel è poco rappresentativo: certamente ora come ora l'A9X nel settore mobile batte qualsiasi offerta Intel... ma nel settore desktop vi è ancora il predominio x86 e un ARM si trova in difficoltà anche nei task più comuni. Inoltre con l'uscita di Skylake Mobile il divario sarà nuovamente riappianato.
E stiamo comunque parlando di proprietà intellettuali ARM e Imagination Technologies, di Apple c'è ben poco.
Per il resto il tuo post è abbastanza confuso, non è infatti chiaro cosa abbia a che fare il settore desktop, con CPU da 40/60+W, con un SoC da ~5W. Quello che è importante sono le performance per W, dove potremmo essere vicini a Skylake. In aggiunta a queste sarebbe interessante conoscere la scalabilità dell'attuale architettura usata da Apple; non credo che scalare fino ai 15W per gli ultrabook sia fuori questione, ad esempio raddoppiando i core e passando a 16 o più cluster per la GPU.
Infine, i Core A57 e A72 sono ben diversi dai core "Twister" di Apple, la cui architettura è ormai piuttosto differente da quella reference di ARM Holdings. Se fosse tutto così semplice come lasci intendere non è chiaro perché nessuno abbia sviluppato SoC altrettanto grandi (in termini di mm^2) e altrettanto performanti (in termini CPU/GPU/bandwidth) nel mondo ARM.
unica cosa figa in ambito desktop è che a pari potenza di una buona cpu del 2008 da 90w e 150 euro adesso ci compri un nuc da 10w con gpu integrata, e fanless, per la stessa cifra. quindi grandissimi migliroamenti in efficienza!
unica cosa figa in ambito desktop è che a pari potenza di una buona cpu del 2008 da 90w e 150 euro adesso ci compri un nuc da 10w con gpu integrata, e fanless, per la stessa cifra. quindi grandissimi migliroamenti in efficienza!
E' vero ma vai a vedere cosa è successo tra il 97 e il 2006 circa in ambito PC
Sono passati dai Pentium MMX a 150MHz ai Core 2 DUO passando da meno di 24 Megaflops a circa 2000 Megaflops (2 GigaFlops) nelle prime versioni. Inoltre anche li, se vedi l'evoluzione delle FPU etc, una CPU moderna, ad esempio il mio i7, è in grado di generare circa 200 GigaFlops di picco in AVX2 10 volte circa cosa era possibile ottenere 6-7 anni fa.
Il discorso è relativo a tanti aspetti, in primo luogo ARM ha goduto in tempi recenti di PP sempre più evoluti che erano già in cantiere a fine decennio scorso, inoltre sono partiti da una architettura molto poco prestante, su cui c'erano pochi stimoli, con clock molto bassi e hanno potuto investirci sopra alla grande.
Per dirti di più, il Cortex A8, che trovavi sui telefoni del 2010, era basato ancora su una architettura in-order. Se guardi Intel quando ha presentato Bay Trail in sostituzione di Bonnel (architettura out of order vs in order) ha più che raddoppiato le prestazioni per colpo di clock, andando vicino in molti casi al +200% di IPC (dovuto anche ad altri fattori).
No, questo è molto meglio: due core anziché tre, e prestazioni nettamente migliori su singolo core.
Con un paio di revisioni rischiano di mettere nel sacco Intel, Macbook, Surface, convertibili vari, tutti insieme, zitti zitti.
Ma anche no: Tested: Why the iPad Pro really isn't as fast a laptop. Articolo lungo (3 pagine: non saltate le altre due dopo aver letto la prima) e tecnico, ma che vale la pena leggere.
Mentre dall'articolo di Anandtech riporto qualche altro dato interessante:
"Finally, it's also worth noting just how large A9X is compared to other high performance processors. Intel's latest-generation Skylake processors measure in at ~99mm2 for the 2 core GT2 configuration (Skylake-Y 2+2), and even the 4 core desktop GT2 configuration (Intel Skylake-K 4+2) is only 122mm2. So A9X is larger than either of these CPU cores, though admittedly as a whole SoC A9X contains a number of functional units either not present on Skylake or on Skylake's Platform Controller Hub (PCH). Still, this is the first time that we've seen an Apple launch a tablet SoC larger than an Intel 4 core desktop CPU."
Da qualche parte avevo letto alcune riflessioni sul fatto che l'architettura è già molto pompata, col fatto che sia in grado di decodificare ed eseguire ben 6 istruzioni per ciclo di clock, ma al momento non sono riuscito a recuperare l'articolo.
Non c'entra, per due motivi: si tratta di 12 core della GPU, e sono core completi.
Forse ti stai confondendo con Android: in generale, i PC non hanno bisogno di zilioni di core. Ovviamente poi dipende sempre da quello che devi farci.
La dimensione dei transistor non è certo il doppio.
Vedi sopra.
Concordo.
Vedremo quando arriveranno le soluzioni mobile di quest'architettura.
E' la sola strada che consenta aumenti prestazionali consistenti, perché quelli architetturali saranno sempre più limitati. L'A9X è già un'architettura molto "tirata".
Concordo.
Vedi sopra.
Pardon. Mi rendo conto di non essere stato chiaro. Questa volta i troppi quote hanno creato confusione, dati i diversi temi.
Nello specifico, mi riallacciavo al fatto che l'architettura fosse già molto tirata.
Nel frattempo ho recuperato la pagina, della recensione dell'ultimo iPhone da parte del solito AnandTech, in cui si analizzava il SoC:
[I]"A7 brought with it Cyclone, a CPU that was not only 64-bit, but thanks to its exceptional (for a mobile CPU) issue width of 6 micro-ops, brought with it a huge jump in single-threaded performance.
[...]
What that gives Apple then is a chance to push the envelope much harder on clockspeeds, taking their already wide CPU designs and turning up the clockspeeds as well."[/I]
D'altra parte RISC out-of-order in grado di (decodificare ed) eseguire 6 istruzioni per ciclo di clock non è che se ne vedano in giro tanti, a causa dell'elevata complessità di progettazione.
Agendo sulle solite cose: dimensioni delle cache, della branch cache, delle entry nei TLB, ecc., ovviamente in accordo ai transistor disponibili e al power-budget.
Stravolgimenti di altro tipo alla microarchitettura, già solida e performante, difficilmente sarà difficile vederne.
In effetti i core sono abbastanza "cicciottelli", ma evidentemente non hanno ancora pensato a questa possibilità grazie ai significativi incrementi prestazionali che hanno ottenuto finora.
Vantaggi di questo tipo arriveranno coi 10nm, e solo se le rese saranno consistenti. Il che, con tutti i problemi degli ultimi tempi, è un terno al lotto...
Fino a che siamo in un ambiente isolato come iOS è un discorso, ma se vogliamo veramente proporre una CPU "desktop class" dobbiamo anche usare applicativi adeguati (non candy crush e imovie).
Vogliamo mica tornare all'era dei PowerPC? Ve li ricordate?
Prima di tutto dovrebbero avere una richiesta dal mercato. Nessuno (es. LG, Samsung, Lenovo) richiede tale performante processore perché non vi sono applicativi tali da richiederlo e i probabili acquirenti, ovvero chi misura i benchmark e compra il device più veloce, è un numero trascurabile affinché l'investimento rientri.
La creazione di un SoC da 150mm2 a 16nm richiede inoltre un investimento colossale ovvero un rischio imprenditoriale che aziende come le sopracitate non sono abituate a prendere (loro basano il loro mercato sui volumi di vendita e quindi preferiscono oggetti a basso costo e con alta rotazione).
Apple ha invece molteplici interessi:
1) Si slega da un futuro probabile fornitore (Intel, che già equipaggia i suoi laptop e desktop) e quindi ottiene minori costi per la fornitura di materiale dei suoi prossimi prodotti
2) Mantiene una leadership tecnologica e quindi alto il valore e la richiesta delle proprie azioni
3) Consolida la partnership ovvero offre un notevole apporto di denaro a quello che diventerà il proprio unico fornitore (TSMC)... che a sua volta reinvestirà in avanzamenti tecnologici di cui potrà nuovamente servirsene
4) Crea un nuovo bisogno nei consumatori ovvero "il tablet che è come un pc, anche se non lo è al 100%, ma ve ne accorgerete tardi" (poiché legato all'ecosistema iOS in cui ancora mancano applicazioni desktop), un rischio di impresa che se va bene può continuare a fruttargli esponenzialmente per il prossimo decennio, in stile iPhone
5) Amplia la sua offerta con un prodotto a metà fra il tablet e il laptop e allo stesso tempo si contrappone all'offerta Microsoft Surface
Fino a che siamo in un ambiente isolato come iOS è un discorso, ma se vogliamo veramente proporre una CPU "desktop class" dobbiamo anche usare applicativi adeguati (non candy crush e imovie).
Infatti. E' meglio lasciar perdere benchmark sintetici come Geekbench, e usare applicazioni reali o benchmark che cercano di simulare un carico reale, com'è sviscerato nell'articolo di cui ho riportato il link, per vedere cosa succede in uno scenario usuale/normale.
No, non c'è mai stato nulla di paragonabile al progetto di Apple, nemmeno da parte di ARM.
Soltanto nVidia ha proposto un progetto molto innovativo, anche se in realtà non è un ARM, ma un'architettura VLIW proprietaria che tramite soft decoder è in grado di eseguire codice ARM.
Con un paio di revisioni rischiano di mettere nel sacco Intel, Macbook, Surface, convertibili vari, tutti insieme, zitti zitti.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".