Quote:
Originariamente inviato da calabar
E chi rimangia nulla?
Quella era una riflessione relativa al caso in cui si considerasse il modulo di BD come dotato di una sola fpu e che il punteggio 0,87 sia riferito ad una di queste.
In ogni caso parliamo di valori superiori al triplo triplicando il numero di fpu, cosa che a me pare anomala.
Pardon... dopo l'edit non ti seguo più!
Quindi l' "equivalenza" con la fpu del k10 vale solo con un thread singolo?
Nel caso di due thread che lavorano entrambi sulla stessa fpu in BD, possiamo considerare un throughput maggiore?
|
Dipende, visto che l'FPU è a tutti gli effetti SMT (quindi puo' eseguire istruzioni di + thread contemporaneamente se ci sono FMAC libere). Per fare un esempio supponiamo che BD esegua 2 thread FPU intensive su un singolo modulo (quindi una sola FPU):
caso 1: Un thread occupa interamente TUTTA la FPU (tipo: uso massivo di AVX). In quel caso, il throughput sarä identico a quello di un K10 single core che esegua gli stessi 2 thread (banalmente essendo l'FPU unica, se entrambi i thread usano entrambe le FMAC, solo 1 thread alla volta puo' eseguire istruzioni in un dato momento - questo molto superficialmente, dipende da come lavora lo scheduler, ma il risultato finale concettualmente dovrebbe essere questo).
caso 2: Un thread usa entrambe le FMAC per un tempo X, e ne lascia una libera per un tempo 1-X dove 1 è il tempo totale di esecuzione del thread. In quel caso interviene la possibilita dell'FMAC libera di eseguire codice dell'altro thread (nel K10 in questo caso le unità utilizzate rimangono ferme). Quindi nel caso 2 il throughput sarä maggiore di un K10 single core, tanto maggiore quanto minore è X.
Il caso 2 potrebbe potenzialmente spiegare l'incremento di 3.62x da single a multithread in cinebench.