Intel Core 2 Extreme QX9650: l'ora di Penryn

Intel Core 2 Extreme QX9650: l'ora di Penryn

Intel presenta ufficialmente la prima cpu della serie Penryn, evoluzione del progetto Core 2 basata su tecnologia produttiva a 45 nanometri e su alcune innovazioni architetturali. Valutiamo le prestazioni della soluzione top di gamma Core 2 Extreme QX9650, processore caratterizzato da 3 GHz di clock, 4 core e 12 Mbytes di cache L2

di pubblicato il nel canale Processori
Intel
 

Introduzione

Nella giornata odierna Intel presenta ufficialmente sul mercato i primi processori Core 2 Extreme QX9650, basati su nuova tecnologia produttiva a 45 nanometri e caratterizzati dall'utilizzo del core noto con il nome in codice di Penryn. La nuova cpu introduce una serie di novità architetturali rispetto alle altre versioni di processore Core 2 Extreme e Core 2 Quad disponibili in commercio, lasciando tuttavia di fatto inalterata la struttura base propria della famiglia di processori indicati con il nome di Core 2: anche per questo motivo Intel ha scelto di non cambiare il nome passando alla nuova architettura.

Partiamo dal primo elemento introdotto da Intel con questo nuovo processore, quello della tecnologia produttiva a 45 nanometri: grazie al nuovo processo più sofisticato è stato possibile ridurre la superficie del processore passando dai 246 millimetri quadrati delle cpu Core 2 Quad a 65 nanometri di tecnologia produttiva sino agli attuali 214 millimetri quadrati della cpu Core 2 Extreme QX9650 (per le soluzioni dual core i valori sono rispettivamente pari a 143 e a 107 millimetri quadrati). Vi è da considerare che la riduzione della superficie del processore è avvenuta nonostante un incremento della dimensione della cache L2, aumentata del 50% passando da 8 Mbytes a 12 Mbytes nelle cpu quad core e da 4 a 6 Mbytes in quelle dual core: poter costruire transistor più piccoli, grazie alla tecnologia a 45 nanometri, porta quale conseguenza diretta anche la possibilità di utilizzare un maggior numero di transistor nel processore cercando di mantenere più piccola o al limite invariata la superficie complessiva.

Una tecnologia produttiva innovativa permette anche di contenere il consumo complessivo del processore: nonostante Intel dichiari per la cpu Core 2 Extreme QX9650 un TDP pari a 130 Watt, verificheremo nel corso dell'articolo come a parità di frequenza di clock con il processore Core 2 Extreme QX6850 il consumo del nuovo arrivato, sia in idle come a pieno carico, sia complessivamente diminuito.

Come la storia recente in fatto di CPU insegna, è ormai consuetudine attendersi un ciclo di vita di due anni per ogni tecnologia produttiva di Intel. Non che allo scadere dei due anni la vecchia tecnologia vada in pensione, sia chiaro; ciò che però tende a ripetersi con una certa ciclicità è la presentazione di una nuova microarchitettura ogni due anni. E' per esempio il caso di Intel Core 2, processori alla base della produzione attuale di Intel e che sono state rinnovate proprio con il passaggio alla nuova tecnologia produttiva a 45 nanometri con i core della famiglia Penryn. La strategia Intel, nota con il nome di tik-tock, vede quindi l'alternanza di un cosiddetto die shrink, cioè dell'utilizzo di un nuovo processo produttivo, al debutto di una architettura di processore completamente rivoluzionaria rispetto a quanto mostrato in precedenza. E' stato così nel passaggio dalle cpu Pentium D a quelle Core 2 Duo, e lo stesso avverrà nel corso della seconda metà del 2008 passando dalle cpu Penryn a quelle note con il nome in codice di Nehalem.

Il passaggio alle cpu della serie Nehalem, con una microarchitettura completamente nuova, avverrà quindi continuando ad utilizzare la stessa tecnologia produttiva a 45 nanometri oggi abbinata alle cpu Penryn. Nonostante Intel abbia anticipato i primi dettagli tecnici delle cpu Nehalem lo scorso mese di Settembre, in occasione del proprio Developer Forum Fall, non vedremo questi processori al debutto prima indicativamente di 12 mesi da oggi: Penryn rappresenterà quindi la base di tutti i processori Intel che verranno commercializzati nel corso del prossimo anno.

penryn_die_shot.jpg (81149 bytes)
die delle cpu Penryn dual core a 45 nanometri: 410 milioni di transistor

Osserviamo il die delle cpu Penryn con architettura dual core: si nota chiaramente come metà della superficie sia occupata dalla cache L2 da 6 Mbytes di capacità, mentre nel lato destro siano presenti i due die con tutte le varie unità di elaborazione indipendenti presenti in ciascuno. Le soluzioni quad core, con una tecnica già adottata da Intel in precedenza per le cpu Core 2 Quad, sono costruite con package MCP: questo implica che i 4 core siano ottenuti affiancando due die dual core, collegati tra di loro attraverso front side bus e ciascuno dotato di una propria cache L2 indipendente, in quantitativo di 6 Mbytes per coppia di processori nella cpu Core 2 Extreme QX9650.

La cache L2 integrata nelle cpu Penryn non solo è superiore in quantitativo a quella delle cpu Core 2 in commercio attualmente, ma ha un'associatività passata da 16 a 24 livelli. Questa modifica permette a tali cpu di avere un hit rate, cioè un tasso di successo nel fornire il dato richiesto dal processore per l'elaborazione, che sia sufficientemente elevato e allo stesso tempo poter mantenere valori di latenza non eccessivamente elevati.

Tra le novità delle cpu Penryn segnaliamo l'integrazione del nuovo set di 47 istruzioni SSE4, per la prima volta presente in processori Intel. Si tratta di un set di istruzioni multimediali che velocizzeranno, al pari di quanto accaduto in passato con le precedenti versioni di istruzioni SSE, varie famiglie di applicazioni, ovviamente a patto che i software ne prevedanoil supporto e che quindi le possano sfruttare. Fra le nuove istruzioni citiamo i sottogruppi Floating Point Dot Product (DPPS, DPPD) ed i Floating Point Round (ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD), coinvolti nell'ottimizzazione delle scene 2D e 3D, a tutto vantaggio degli ambiti gaming ed in generale in tutti quelli che richiedono un uso massiccio dei calcoli in virgola mobile.

Tra le altre novità archittetturali implementate da Intel nel Core Penryn segnaliamo un nuovo algoritmo radix-16, che ottimizza alcune tipologie di elaborazioni sia in vorgola mobile che intere con un positivo impatto sulla latenza. Il Super Shuffle Engine integrato nelle cpu Penryn migliora nel complesso le prestazioni delle istruzioni SSE nell'esecuzione di elaborazioni di tipo shuffle. Vediamo ora in dettaglio come il nuovo processore s'inserisca all'interno della famiglia di processori Core 2 di Intel.

 
^