Hardware Upgrade - Logo
« Torna all'articolo  -  Stampa
Intel Core i7: prestazioni delle prime cpu Nehalem
Paolo Corsini - 03 Novembre 2008
"Al debutto nel corso del mese di Novembre, i processori Intel Core i7 sono i primi basati su architettura Nehalem a venir proposti sul mercato. Le novità archittetturali permettono di ottenere prestazioni mediamente sempre più elevate delle corrispondenti soluzioni Core 2 Quad"
Pagina 1 - Introduzione

cpu_foto.jpg (50661 bytes)

La scorsa settimana abbiamo pubblicato, a questo indirizzo, il nostro primo articolo incentrato sui processori Intel della famiglia Nehalem, nuova generazione di cpu del produttore americano attese al debutto nel corso del mese di Novembre. Con questo secondo articolo passiamo ad una prima analisi prestazionale delle 3 versioni di processore Core i7 che Intel immetterà sul mercato nelle prossime settimane; parliamo di proposte per il segmento di fascia medio alta del mercato, basate su nuove schede madri Socket LGA 1366 con le quali devono essere abbinati kit memoria DDR3 di tipo triple channel.

socket_lga_1366.jpg (101413 bytes)
Socket LGA 1366, per processori Core i7

Questi processori prenderanno progressivamente il posto delle soluzioni Core 2 Quad top di gamma ma considerando la necessità di acquistare una nuova scheda madre riteniamo che la migrazione alla nuova tecnologia non sarà molto rapida. Osservando la roadmap dei processori Intel, del resto, arrivano conferme in questa direzione: le 3 cpu Core i7 analizzate in queste pagine continueranno a restare quali proposte top di gamma del mercato sino a circa la metà del 2009, mentre per le soluzioni Core 2 Quad non si anticipa una rapida uscita di scena.

Queste le caratteristiche tecniche dei processori Core i7 oggetto dell'analisi odierna:

  • Core i7 965 Extreme Edition:  frequenza di clock di 3,2 GHz; bus QPI a 6,4 Gigatransfert/sec; cache L3 da 8 Mbytes; memoria DDR3-1333; TDP massimo 130 Watt; Overspeed protection disabilitata. Prezzo ufficiale al debutto pari a 999 dollari USA; tasse escluse;
  • Core i7 940: frequenza di clock di 2,93 GHz; bus QPI a 4,8 Gigatransfert/sec; cache L3 da 8 Mbytes; memoria DDR3-1333; TDP massimo 130 Watt; Overspeed protection abilitata. Prezzo ufficiale al debutto pari a 562 dollari USA; tasse escluse;
  • Core i7 920: frequenza di clock di 2,66 GHz; bus QPI a 4,8 Gigatransfert/sec; cache L3 da 8 Mbytes; memoria DDR3-1333; TDP massimo 130 Watt; Overspeed protection abilitata. Prezzo ufficiale al debutto pari a 284 dollari USA; tasse escluse.

I due processori 940 e 920 sono identici quanto a specifiche tecniche, con l'unica differenza data dalla frequenza di clock. Per il modello Core i7 965 Extreme Edition le differenze sono più sensibili: la frequenza di clock è incrementata sino a 3,2 GHz, mentre la frequenza di clock del bus QPI sale sino a 3,2 GHz, equivalenti a 6,4 Gigatransfers al secondo. Non variano TDP e quantitativo di cache L2 ma la Overspeed Protection è stata rimossa permettendo quindi al processore di portarsi a frequenze di funzionamento superiori a quelle di specifica superando i limiti in termini di TDP e di alimentazione del processore predefiniti da Intel per queste cpu.

cpu_z.gif (17426 bytes)
schermata di CPU-Z del processore Core i7 965 Extreme
la frequenza di clock in idle è influenzata dalla tecnologia Turbo Mode

Ci preme segnalare come quello odierno non sia il lancio ufficiale sul mercato dei processori Core i7; questo avverà tra due settimane, il 17 Novembre. Intel ha scelto, come del resto già fatto in passato, di autorizzare la pubblicazione di analisi prestazionali sulle nuove cpu in anticipo rispetto al debutto.

Pagina 2 - Configurazione di test

Abbiamo eseguito un confronto incentrato sui soli processori Intel delle famiglie Core i7 e Core 2 Quad, escludendo processori non quad core e le soluzioni AMD Phenom. Nel primo caso la scelta è stata ovvia, in quanto le 3 cpu Core i7 al debutto sono tutte di tipo quad core; per il secondo caso la scelta è giustificata dal costo d'acquisto delle cpu Phenom, che anche prendendo il modello top di gamma Phenom X4 9950 Black Edition è sensibilmente inferiore a quello della cpu Core i7 920 e delle corrispondenti soluzioni Core 2 Quad di Intel.

L'esclusione di processori Intel Core 2 Duo, dotati di architettura dual core, è giustificata anche dalle differenze di prezzo esistenti tra questi processori e le soluzioni Core i7. Queste le caratteristiche tecniche dei processori inseriti nel confronto:

  Intel Core i7
965 Extreme
Intel Core i7
940
Intel Core i7
920
Intel Core 2
Extreme QX9770
Intel Core 2
Quad Q9650
Intel Core 2
Quad Q9550
Intel Core 2
Quad Q9300
Clock 3,2 GHz 2,93 GHz 2,66 GHz 3,2 GHz 3 GHz 2,83 GHz 2,5 GHz
Core 4 4 4 4 4 4 4
HT si si si no no no no
Cache L2 4x256 Kbytes 4x256 Kbytes 4x256 Kbytes 2x6 Mbytes 2x6 Mbytes 2x6 Mbytes 2x3 Mbytes
Cache L3 8 Mbytes 8 Mbytes 8 Mbytes no no no no
Bus 6,4 GT/s 4,8 GT/s 4,8 GT/s 1.600 MHz 1.333 MHz 1.333 MHz 1.333 MHz
Prezzo ufficiale in USD 999 562 284 1.399 530 316 266

Di seguito i componenti utilizzati nel confronto prestazionale tra i processori Core i7 e Core 2 Quad:

  • scheda madre cpu Intel Core i7: Intel Desktop Board DX58SO Extreme Series (chipset Intel X58);
  • scheda madre cpu Intel Core 2: Gigabyte GA-X48T-DQ6 (chipset Intel X48 Express);
  • scheda video: Zotac GeForce GTX 280 AMP! Edition (clock GPU 700 MHz; clock stream processors 1.400 MHz; clock memoria video 2.300 MHz);
  • hard disk: 2 dischi Seagate Barracuda 7200.10 SATA, in configurazione Raid 0;
  • memoria sistema Core i7: 3 moduli Corsair DDR3-1333 da 2 Gbytes ciascuno, timings 9-9-9-24;
  • memoria sistema Core 2: 4 moduli Corsair DDR3-1333 da 1 Gbytes ciascuno, timings 8-8-8-22;
  • sistema operativo Windows Vista Ultimate 64bit, Service Pack 1;
  • driver video: NVIDIA Forceware 178.24.

scheda_madre.jpg (60260 bytes)
scheda madre Intel Desktop Board DX58SO Extreme Series

La piattaforma per processori Intel Core i7 è dotata di 6 Gbytes di memoria di sistema, mentre quella con cpu Intel Core 2 è abbinata a 4 Gbytes di memoria; la differenza è dovuta al tipo di memory controller abbinato ai due processori. I test che abbiamo eseguito rientrano tutti, come occupazione di memoria, entro la soglia dei 4 Gbytes della piattaforma Socket 775 LGA pertanto i 2 Gbytes addizionali della piattaforma Core i7 non influenzano i risultati ottenuti.

La tecnologia Turbo Mode è sempre stata lasciata attiva con i processori Core i7 in prova, selezionando un moltiplicatore di frequenza massimo pari a quello di default +2 per il primo core, e a default +1 per i 3 restanti core.

Queste le applicazioni utilizzate nel confronto prestazionale:

  • Povray 3.7 beta 29 - 64bit
  • Cinebench 10 - 64bit
  • 3ds Max 2009 x64
  • WinRAR 3.80
  • 3D Mark 2006
  • 3D Mark Vantage
  • Lost Planet DX9
  • Unreal Tournament 3
  • Half Life 2 Episode 2
  • Crysis
  • Divx 6.8 - Virtualdub 1.8.6
  • AutoMVK x264
  • Sony Vegas 8.0b
  • Windows Movie Maker
  • Windows Media Encoder 9
  • Mainconcept Reference Encoder and Decoder 1.5
  • Sandra 2009 1.15.42
  • Everest Ultimate 4.60.1500
Pagina 3 - Controller memoria

Iniziamo l'analisi delle cpu Core i7 utilizzando il modello 965 Extreme, con clock di 3,2 GHz, a confronto con la soluzione Core 2 Extreme QX9770, operante alla stessa frequenza. Con questi test vogliamo valutare quale sia l'incidenza del memory controller triple channel integrato nei processori Core i7, rimandando ad un successivo articolo un'analisi ancor più approfondita al variare di tipologia e quantità di memoria.

everest_bandwidth.png (36703 bytes)

sandra_bandwidth.png (28740 bytes)

Sia Everest che Sandra, i due tool utilizzati per queste analisi, evidenziano valori di bandwidth della memoria di sistema sensibilmente più elevati con la cpu Core i7 965 Extreme. Ricordando che per entrambe le piattaforme è stata utilizzata memoria DDR3-1333, è evidente come gli incrementi in termini di bandwidth possano essere giustificati solo in parte con l'architettura triple channel della piattaforma Core i7 contro quella dual channel delle cpu Core 2.

L'implementazione adottata dalle cpu Nehalem, con memory controller integrato nel processore e non esterno nel north bridge del chipset, permette di raggiungere un'efficienza più elevata rispetto a quanto a disposizione con le cpu Core 2: prendendo quale riferimento i valori registrati con Sandra 2009 la cpu Core i7 ottiene una bandwidth pari a circa il 70% del valore massimo teorico, mentre per la cpu Core 2 Quad siamo a poco meno del 35% dei 21,3 Gbytes al secondo teorici.

everest_latenza.png (20951 bytes)

sandra_latenza.png (20591 bytes)

Il memory controller integrato permette di diminuire sensibilmente la latenza di accesso della memoria, trend del resto già visto da tempo analizando le cpu AMD della sere Athlon 64 e successive che implementano proprio questo tipo di architettura. In funzione del tipo di test la riduzione della latenza è più o meno elevata ma in ogni caso evidente.

Pagina 4 - Sfida a 3,2 GHz: Core 2 vs Core i7

Passiamo ora all'analisi delle prestazioni velocistiche delle cpu Nehalem confrontando, a parità di frequenza di clock, il processore Core i7 965 Extreme con il modello Core 2 Quad QX9770; la finalità di questo confronto è quello di capire quali siano i miglioramenti introdotti con l'architettura Nehalem rispetto a quella Penryn di precedente generazione. Evidenziamo come il processore Core i7 965 Extreme sia stato misurato tenendo abilitata sia la tecnologia Hyper-Threading che quella Turbo Mode.

confronto_core2_i7.png (118768 bytes)

In funzione del tipo di applicazione evidenziamo incrementi prestazionali molto elevati passando alla cpu Core i7: nel momento in cui possono venir sfruttati gli 8 core logici di questa cpu, con tecnologia Hyper-Threading abilitata, le prestazioni crescono sensibilmente come con Povray oppure con il test Cave di Lost Planet. In media l'incremento prestazionale è sensibile ma abbiamo registrato alcuni specifici ambiti nei quali le prestazioni sono leggermente diminuite: è il caso di Lost Planet Snow e di Unreal Tournament 3.

Per quale motivo le prestazioni velocistiche sono diminuite con alcuni test, nonostante la cpu Core i7 implementi tecnologia Hyper-Threading e siano disponibili varie nuove funzionalità che incrementano le prestazioni all'interno delle architetture Nehalem? La risposta a questa domanda è legata a vari fattori, ma come vedremo nella pagina seguente è proprio la tecnologia Hyper-Threading a rivestire un ruolo molto importante nello spiegare questo calo prestazionale.

Nel complesso questo confronto decreta una chiara vittoria per la cpu Core i7 965 Extreme, sia sul piano delle pure prestazioni velocistiche assolute che inserendo nel confronto la componente prezzo: questo processore è proposto nel listino ufficiale di Intel a 999 dollari, mentre per la cpu Core 2 Quad QX9770 il prezzo ufficiale è pari a 1.399 dollari.

Pagina 5 - Quanto incide Hyper-Threading?

Abbiamo evidenziato come Intel abbia scelto di non implementare la tecnologia Hyper-Threading all'interno delle proprie cpu della serie Core 2, ma di attendere sino alle soluzioni Nehalem prima di ripristinare questa tecnologia. Ritornando con la memoria a come questa tecnologia operasse con le soluzioni Pentium 4, ricordiamo come il suo impatto sulle prestazioni velocistiche fosse generalmente molto interessante salvo alcune eccezioni, nelle quali le prestazioni anziché crescere diminuivano. Osservando il grafico seguente ritroviamo in alcuni casi quello scenario: anche con le cpu Core i7 l'abilitazione della tecnologia Hyper-Threading può avere impatti negativi sulle prestazioni velocistiche.

confronto_ht.png (113510 bytes)

Nel corso dei nostri test abbiamo riscontrato come l'impatto negativo sulle prestazioni dato dalla tecnologia Hyper-Threading sia più netto con quegli ambiti che per loro natura sono single threaded, o nei quali vengono utilizzati solo alcuni core. La sensazione che se ne ricava è che sia lo scheduler del sistema operativo a non sfruttare al meglio la differenza tra core logici e core fisici, con un impatto negativo sulle prestazioni nel momento in cui al posto di utilizzare tutti i core fisici a disposizione i task vengano delegati anche a core logici, lasciando quelli fisici solo parzialmente utilizzati.

Prendendo quale riferimento un'applicazione che sfrutta al massimo 4 core, con tecnologia Hyper-Threading disabilitata avremo la certezza che i 4 thread paralleli verranno processati da 4 processori fisici; con Hyper-Threading abilitato è tutto delegato allo scheduler del sistema operativo, che potrebbe non eseguire le migliori azioni in termini prestazionali sfruttando uno o più core logici lasciando in idle alcuni core fisici.

In generale il consiglio è quello di lasciare abilitata la tecnologia Hyper-Threading con questi processori in quanto il beneficio prestazionale medio che se ne ottiene è superiore all'impatto negativo che è possibile ottenere con alcune applicazioni.

Pagina 6 - I benefici di Turbo Mode

Ripristiniamo il processore Core i7 965 Extreme alle impostazioni di default abilitando la tecnologia Hyper-Threading ed analizziamo quale sia l'incidenza sulle prestazioni data dalla tecnologia Turbo Mode. Come abbiamo evidenziato nell'analisi architetturale, Turbo Mode incrementa la frequenza di clock del processore rispetto al massimo in funzione sia del carico di lavoro istantaneo del processore che dei parametri di funzionamento quali temperatura e alimentazione.

Il moltiplicatore di frequenza di default del processore Core i7 965 Extreme è pari a 24x, che abbinato alla frequenza base del processore di 133 MHz permette di ottenere la frequenza di clock finale di 3,2 GHz. Turbo Mode è impostato di default dal bios in modo tale da permettere di portare il moltiplicatore a 26x, con questo processore, nel momento in cui c'è 1 dei 4 core fisici occupato; qualora il numero dei core occupati sia compreso tra 2 e 4 il moltiplicatore massimo selezionabile con Turbo Mode è pari a 25x. Con moltiplicatore 26x si ottiene una frequenza di clock pari a 3,46 GHz, che scende a 3,33 GHz con moltiplicatore 25x.

confronto_turbomode.png (112439 bytes)

L'utilizzo della tecnologia Turbo Mode permette di ottenere in quasi tutti gli ambiti applicativi un incremento prestazionale; gli unici ambiti dove non si sono ottenute di fatto variazioni sono quelli nei quali la potenza elaborativa della scheda video incide più che l'incremento di clock del processore. E' quindi consigliato tenere sempre abilitata la tecnologia Turbo Mode con i processori Core i7, in quanto non si hanno ripercussioni negative sulle prestazioni velocistiche.

Abbiamo segnalato quali siano i parametri di intervento della tecnologia Turbo Mode con il processore Core i7 965 Extreme; nella tabella seguente riassumiamo tutti i parametri per le 3 versioni di processore Core i7 attese al debutto.

Processore Clock
default
Moltiplicatore
default
Turbo Mode
Core 1
Turbo Mode
Core 2
Turbo Mode
Core 3
Turbo Mode
Core 4
Core i7 965 3,2 GHz 24x 26x 25x 25x 25x
Core i7 940 2,93 GHz 22x 24x 23x 23x 23x
Core i7 920 2,66 GHz 20x 22x 21x 21x 21x

Essendo questa tecnologia dipendente dalle condizioni di funzionamento del processore è possibile che si abbiano risultati variabili nel momento in cui si utilizzano diversi sistemi di raffreddamento; più efficiente sarà questo componente, maggiori le probabilità che Turbo Mode intervenga a incrementare la frequenza di clock del processore anche quando sono utilizzati contemporaneamente tutti i core a disposizione.

Pagina 7 - Rendering

Passiamo ora ad analizzare quelle che sono le prestazioni velocistiche delle 3 versioni di processore Core i7 a confronto con 4 modelli di cpu Core 2 Quad, con frequenze di clock comprese tra 3,2 GHz e 2,5 GHz. Ricordiamo come in tutti questi test le tecnologie Hyper-Threading e Turbo Mode siano state attivate per tutte e 3 le cpu Core i7.

povray.png (45145 bytes)

Il primo test è quello con la versione 3.7 beta 29 di Povray, eseguito con codice a 64bit utilizzando il benchmark multi CPU integrato. Il vantaggio delle soluzioni Core i7 è netto; del resto, è il test tra quelli utilizzati nell'articolo nel quale l'abilitazione della tecnologia Hyper-Threading permette di ottenere i più elevati benefici prestazionali.

3dsmax.png (44107 bytes)

Il secondo test consiste nel rendering della scena Dragon_character_rig con la versione 2009, in codice a 64bit, di 3ds Max; il rendering è limitato al primo frame ed è stato eseguito alla risoluzione di 1920x1080 pixel.

cinebench.png (57215 bytes)

Il terzo test è un classico nell'analisi di processori: si tratta di Cinebench 10, benchmark che permette di valutare quali siano le prestazioni medie ottenibili con il software Cinema 3D. I valori riportati sono quelli dell'analisi dei tempi di rendering, sia in configurazione a singola CPU che con tutte le cpu a disposizione nel sistema.

Tutti questi test vedono saldamente in testa i processori Core i7, in grado anche con il modello 920 con frequenza di clock di 2,66 GHz di distanziare la proposta top di gamma tra le cpu Intel Core 2 Quad, modello QX9770. Da un lato le innovazioni architetturali implementate nelle cpu Core i7, dall'altro la tecnologia Hyper-Threading permettono di ottenere questi risultati; è significativo ricordare come le cpu Core 2, sin dal debutto, avessero rappresentato il punto di riferimento anche in questo ambito applicativo rispetto alle cpu dual e quad core di AMD.

Pagina 8 - Giochi 3D

I test con giochi e benchmark 3D sono stati eseguiti utilizzando una scheda video NVIDIA GeForce GTX 280 di Zotac, modello della serie AMP! Edition; questa scheda si differenzia dalla reference board NVIDIA in quanto opera con GPU a 700 MHz, 240 stream processors a 1.400 MHz e 1 Gbyte di memoria video a 2.300 MHz.

3dmark_2006.png (49775 bytes)

3dmark_vantage.png (53336 bytes)

I due test della serie 3D Mark sono stati inseriti in quanto integrano al proprio interno dei test specifici che misurano quale sia l'impatto del processore utilizzato nel sistema, sfruttando inoltre la presenza di più di 4 core. Non utilizziamo tipicamente questi test per valutare le capacità prestazionali di schede video poste a confronto tra di loro, in quanto riteniamo che vari giochi 3D siano più attendibili nel tracciare un quadro prestazionale delle moderne GPU, ma per la finalità di questo articolo che è quello di confrontare processori differenti i due 3D Mark sono strumenti utili.

crysis.png (56458 bytes)

In Crysis abbiamo utilizzato il demo di default, utilizzando le risoluzioni video di 1024x768, 1280x1024 e 1600x1200 pixel per poter ottenere risultati che fossero per quanto possibili più dipendenti dal processore che dalla scheda video utilizzata. Al pari di quanto ottenuto con i test 3D Mark, anche con Crysis i processori Intel Core i7 sono nettamente in vantaggio rispetto alle soluzioni Core 2 Quad. In particolare evidenziamo come al crescere della risoluzione video i frames tendano a convergere verso lo stesso valore tra le due famiglie di processori, con un netto margine di vantaggio per le soluzioni Core i7 su quelle Core 2.

Pagina 9 - Giochi 3D: continua

hl2_ep2.png (57376 bytes)

Half-Life 2 Episode 2 è stato valutato abilitando anti aliasing 4x e filtro anisotropo 16x, con la più elevata impostazione qualitativa possibile; le risoluzioni adottate sono quelle di 1024x768, 1280x1024 e 1600x1200 pixel mentre la scena è quella integrata nel benchmark sviluppato da Hocbench. E' evidente come Half Life 2 Episode 2, con le impostazioni utilizzate nei test, sia CPU limited a tutte le risoluzioni con pressoché tutte le cpu in prova: al crescere della frequenza di clock della cpu incrementano le prestazioni velocistiche. Il processore Core 2 Quad Q9300 rimane nettamente distanziato sia per l'inferiore frequenza di clock sia per il ridotto quantitativo di cache L2, pari a 6 Mbytes contro i 12 Mbytes delle altre cpu Core 2.

lp_cave.png (60787 bytes)

lp_snow.png (61678 bytes)

Abbiamo inserito il benchmark integrato in Lost Planet in quanto contiene una scena, cave, che permette di sfruttare appieno tutti e 8 i core messo a disposizione dalle cpu Core i7; questo ne spiega il notevole margine di vantaggio rispetto alle soluzioni Core 2 Quad, tale da sfiorare il 70% circa a 3,2 GHz di clock alla risoluzione di 1024x768 pixel. Per la scena snow troviamo invece frames al secondo medi molto allineati tra i vari processori a tutte le risoluzioni, evidente segnale di come in questo caso il collo di bottiglia sia nella potenza elaborativa della scheda video.

ut3.png (57449 bytes)

Chiudiamo con Unreal Tournament 3, analizzato disabilitando l'anti aliasing e con filtro anisotropo 16x attivo; la mappa scelta è quella DM-ShangriLa_fly con il benchmark sviluppato da HocBench. Ritroviamo risulltati simili a quanto visto con Half-Life 2 ma in questo caso i processori Core 2 Quad si sono dimostrati essere leggermente più veloci di quelli Core i7 a parità di frequenza di clock. Abbiamo visto in precedenza come Unreal Tournament 3 sia uno degli ambiti applicativi nei quali l'abilitazione della tecnologia Hyper-Threading porta ad un lieve impatto negativo sulle prestazioni velocistiche complessive del sistema: questo componente può quindi giustificare il divario prestazionale.

Pagina 10 - Multimedia

winrar.png (44372 bytes)

Il test di compressione con WinRAR 3.80 è stato eseguito misurando i tempi di compressione di 5 immagini .tif da circa 70 Mbytes ciascuna, ottenendo un archivio .rar unico.

automvk.png (44057 bytes)

Con AutoMKV abbiamo misurato il tempo necessario ad eseguire una conversione da formato avi a h.264 di un video da 416 Mbytes di dimensione, con risoluzione di 720x480 pixel.

divx.png (43965 bytes)

Con VirtualDub abbiamo convertito un video con risoluzione nativa di 1920x1080 pixel, in standard DV, nel formato Divx alla risoluzione di 720x480 pixel; il codec è stato configurato con il preset "Home Theater Profile" con bitrate fisso di 780 e abilitando il supporto alle istruzioni SSE4, sfruttato sia dalle cpu Core i7 che da quelle Core 2.

Pagina 11 - Multimedia: continua

mainconcept.png (45418 bytes)

Con la versione 1.5 di Mainconcept Reference abbiamo eseguito la conversione di un video con risoluzione nativa di 1920x1080 pixel, in standard DV, utilizzando il preset standard con profilo H-264/AVC Pro.

sony_vegas.png (44776 bytes)

Con Sony Vegas 8.0c abbiamo misurato il tempo necessario a creare una immagine ISO per la successiva masterizzazione su supporto Blu-Ray. Alla base un video di circa 2 minuti di durata, con risoluzione di 1440x1080 pixel, da circa 370 Mbytes di dimensione. L'output video creato è con risoluzione di 1920x1080 pixel.

wme9.png (46276 bytes)

In Windows Media Encoder 9 abbiamo convertito un flusso video a 1080p, il trailer del film Alexander, alla risoluzione di 720p utilizzando codec audio multichannel e il preset per l'archiviazione su PC del flusso video presente in Windows Media Encoder.

wmm.png (46742 bytes)

Con Windows Movie Maker abbiamo eseguito il transcoding a 720p di un flusso video con risoluzione nativa di 1920x1080 pixel, in standard DV, utilizzando il preset per Windows Media HD per Xbox 360 PAL. I processori Core i7 si sono confermati essere sempre la soluzione più veloce in quasi tutti i test multimediali eseguiti; l'eccezione è rappresentata da Windows Media Encoder e da Windows Movie Maker, di fatto i test meno aggiornati tra quelli condotti oltre che gli unici due che registrano un impatto prestazionale negativo nel momento in cui viene abilitata la tecnologia Hyper-Threading.

Pagina 12 - Consumi

Per analizzare il consumo dei sistemi basati su processore Intel Core i7, a confronto con configurazioni simili dotate di cpu Intel Core 2 Quad, abbiamo misurato il consumo complessivo del sistema a monte dell'alimentatore: i valori in Watt forniti si riferiscono quindi al consumo dell'interno sistema e non al solo processore. Di seguito i componenti adottati per le configurazioni Socket LGA 1366 e Socket 775:

  • scheda madre cpu Intel Core i7: Intel Desktop Board DX58SO Extreme Series (chipset Intel X58);
  • scheda madre cpu Intel Core 2: Gigabyte GA-X48T-DQ6 (chipset Intel X48 Express);
  • scheda video: Zotac GeForce GTX 280 AMP! Edition (clock GPU 700 MHz; clock stream processors 1.400 MHz; clock memoria video 2.300 MHz);
  • hard disk: 2 dischi Seagate Barracuda 7200.10 SATA, in configurazione Raid 0;
  • memoria sistema Core i7: 3 moduli Corsair DDR3-1333 da 2 Gbytes ciascuno, timings 9-9-9-24;
  • memoria sistema Core 2: 4 moduli Corsair DDR3-1333 da 1 Gbytes ciascuno, timings 8-8-8-22;
  • alimentatore Cooler Master 1.000 Watt.

consumo_2.png (40461 bytes)

consumo_1.png (41731 bytes)

I sistemi con processori Core i7 evidenziano un consumo complessivo, sia in idle che a pieno carico, complessivamente superiore a quello delle soluzioni Core 2 Quad dotate di scheda madre Intel X48. Considerando l'incremento prestazionale complessivo ottenibile con i nuovi processori Intel questi livelli di consumo complessivo non devono impensierire: da considerare inoltre che è stata mantenuta attiva la tecnologia Turbo Mode, pertanto le 3 cpu Core i7 a pieno carico hanno operato ad una frequenza di clock superiore a quella di default.

Pagina 13 - Overclock

Passiamo ora ad alcuni cenni sull'overclock dei processori Core i7 definendo alcune premesse: la tecnologia Turbo Mode opera un overclock dinamico in modo automatico, a seconda del tipo di carico di lavoro del processore e delle condizioni di uso. Per sua natura questa tecnologia non interviene selezionando in modo fisso un moltiplicatore di frequenza superiore a quello di default del processore. Non è possibile intervenire sul moltiplicatore di frequenza dei processori Core i7, fatta eccezione per il solo modello Core i7 965 Extreme, al pari delle altre cpu Intel in commercio.

bios_3.jpg (43694 bytes)
Dynamic Speed Technology, il nome commerciale di Turbo Mode
si noti l'impostazione del moltiplicatore della cpu di default e i 4 distinti
parametri per il moltiplicatore massimo in funzione del numero di core attivi

Il vantaggio di Turbo Mode è quello di permettere di ottenere di fatto un agevole overclock automatico del processore, lasciando che il moltiplicatore di frequenza del processore vari dinamicamente dal valore di default a quello massimo selezionato via bios a condizione ovviamente che i parametri di funzionamento base del processore, alimentazione e temperatura, permettano alla cpu di operare con moltiplicatore superiore a quello di default in modo stabile. La frequenza di clock, di conseguenza, continua a variare in modo dinamico a seconda del carico di lavoro istantaneo e dei parametri di funzionamento della cpu, permettendo di ottenere un incremento prestazionale che non può essere a priori definito chiaramente come con un overclock fisso ma che è in ogni caso positivo.

bios_2.jpg (29440 bytes)
oltre ai timings memoria, da bios è possibile selezionare i moltiplicatori di frequenza
sia della memoria che dell'Unicore (UCLK Multiplier)

Come incrementare la frequenza di clock del processore? Oltre che via moltiplicatore di frequenza, ma solo in presenza di un processore della serie Extreme, è possibile intervenire sulla cosiddetta frequenza di clock base, cioè quel valore che moltiplicato con il moltiplicatore di frequenza permette di ottenere la frequenza di clock. Di default questo parametro è pari a 133 MHz ed è responsabile, oltre che della frequenza di clock finale del processore, anche delle frequenze di funzionamento del bus QPI e dell'Unicore, cioè quella parte della logica del processore nella quale non si trovano i singoli core e che quindi racchiude memory controller e cache L3.

Unicore viene alimentato non con il voltaggio di alimentazione core del processore, ma con il VTT: di conseguenza se si vuole incrementare la frequenza di funzionamento dell'Unicore è indispensabile intervenire via VTT e non via voltaggio Core. La frequenza di lavoro dell'Unicore è ottenuta moltiplicando la frequenza di clock base con il moltiplicatore dell'Unicore, variabile tra i valori di 10 e di 30. In generale la frequenza di funzionamento del memory controller, e quindi dell'Unicore, deve essere pari a 2 volte quella della memoria utilizzata; nel caso di memoria DDR3-1333, pertanto, tale valore dovrà essere pari a 2.667 MHz, ottenuto utilizzando moltiplicatore pari a 20x.

E' possibile intervenire a variare la frequenza di funzionamento del bus QPI ma in generale questo non è consigliabile: l'incidenza sulle prestazioni velocistiche è infatti così ridotta da rendere preferibile l'intervenire su altri parametri. Anche la frequenza del bus QPI è ottenuta utilizzando la frequenza di clock base di 133 MHz e un moltiplicatore specifico, selezionabile tra i valori di 18x e 24x.

I processori non appartenenti alla famiglia Extreme integrano una funzionalità nota con il nome di Overspeed Protection: il processore integra al proprio interno della circuiteria di monitoraggio della corrente assorbita e del TDP istantaneo del processore, verificando che non vengano mai superati i valori di 100A e 130 Watt. Qualora in overclock il processore dovesse spingersi oltre questi limiti la funzionalità Overspeed Protection riporterebbe il processore alle frequenze di clock di default, annullando l'overclock.

bios_1.jpg (34562 bytes)
la frequenza di clock del bus QPI può essere selezionata direttamente da bios

Da ultimo, l'overvolt della memoria di sistema, argomento del quale si è a lungo discusso. Intel sconsiglia di alimentare oltre i 1.65V i moduli memoria DDR3 in quanto questo potrebbe portare a danneggiamenti del processore. L'indicazione fornita da Intel resta valida in senso generale: per un utilizzo di lungo periodo del sistema è bene non spingersi oltre 1.65V con le memorie DDR3. In caso di sessioni di test o di benchmark spinti è possibile utilizzare voltaggi della memoria DDR3 più elevati alla ricerca delle massime frequenze di clock supportate dai propri moduli, ma per un funzionamento prolungato nel tempo è preferibile restare entro le specifiche.

Pagina 14 - Considerazioni

Intel è riuscita ancora a stupire al debutto di una nuova architettura di microprocessore con le soluzioni Core i7, le prime della famiglia Nehalem al debutto in sistemi desktop. L'impatto non è a nostro avviso così netto come quanto avvenuto al debutto delle soluzioni Core 2, nel mese di Luglio 2006: del resto in quella occasione una nuova architettura dalle eccellenti caratteristiche doveva prendere il posto di quella Netburst delle cpu Pentium 4 e Pentium D, ormai non più in grado da tempo di stare al passo con quella K8 sviluppata da AMD.

finale.jpg (41181 bytes)

L'architettura dei processori Nehalem non può essere definita come un cambiamento radicale rispetto a quella Core 2; Intel ha basato Nehalem sugli elementi base delle soluzioni Core 2 implementando una lunga serie di caratteristiche in grado di incidere sensibilmente sulle prestazioni e sulla flessibilità d'uso. In particolare l'approccio modulare permetterà ad Intel di sviluppare differenti versioni di processore Nehalem con caratteristiche specificamente implementate a seconda del posizionamento di mercato dello specifico processore. Un esempio lampante saranno le versioni di processore Nehalem attese alla fine del prossimo anno, nelle quali Intel integrerà anche una propria GPU dalle specifiche tecniche simili a quanto integrato nei chipset della serie G.

In considerazione dell'incidenza della tecnologia Hyper-Threading sulle prestazioni velocistiche con alcune delle applicazioni inserite nei test, proviamo a estrapolare un confronto ipotetico, quello tra processori Core 2 Quad e Core i7 con tecnologia Hyper-Threading disabilitata: ne otteniamo risultati prestazionali da processori quad core, entrambi con frequenza di clock di 3,2 GHz abbinati a memoria DDR3-1333.

confronto_core2_i7_no_ht.png (116121 bytes)

Gli incrementi prestazionali della nuova architettura Nehalem, a confronto con quella delle cpu Core 2 Quad, sono notevoli anche con tecnologia Hyper-Threading disabilitata. Solo con due titoli inseriti nel confronto abbiamo evidenziato un lieve peggioramento delle prestazioni ma si tratta di valori circoscritti, non tali da far cambiare il quadro complessivo.

Intel continua a mantenere il proprio vantaggio tecnologico nel settore dei processori con le nuove soluzioni Nehalem; le cpu Core i7, disponibili in commercio a partire dalle prossime settimane, distanziano i processori Core 2 Quad in modo tangibile ma il loro acquisto richiederà un esborso economico non indifferente. L'adozione di un nuovo Socket di connessione, quello LGA 1366, richiede infatti l'utilizzo di una nuova scheda madre: i modelli attualmente disponibili in commercio sono tutti posizionati nel segmento di fascia alta del mercato, elemento che se può essere giustificato nel caso del processore Core i7 965 Extreme non lo è di certo per la cpu Core i7 920, processore dalle notevoli potenzialità che viene proposto a 284 dollari di prezzo ufficiale.

Nei prossimi giorni continueremo la nostra analisi delle cpu Nehalem e delle piattaforme Socket LGA 1366, soffermandoci sul funzionamento del controller memoria triple channel e di come questo componente incida sulle prestazioni velocistiche complessive. In seguito passeremo all'analisi delle piattaforme Multi GPU NVIDIA SLI e ATI CrossfireX in abbinamento a processori Core i7, per dare in seguito spazio alle prime schede madri Socket LGA 1366 basate su chipset Intel X58 giunte in redazione.