una pipeline lunga è ottima per scalare in frequenza ma ovviamente è molto complessa da gestire e la circuiteria di branch prediction è molto complicata...questo avveniva con i primi Pentium 4 core Northwood (versioni A e B) poi con la versione C (e con solo alcune versioni della B) c'è stata l'introduzione del HT che in pratica divide la pipeline in due parti (creando una sorta di parallelismo) e lo svuotamente e l'eventuale immissione di micro-istruzioni da elaborare poteva essere fatto anche a metà della pipeline
ora si tende ad aumentare l'efficenza come ha detto quartz piuttosto che ha curarsi della forza bruta