La mia "stringa perfetta" č quella di default per il mio Athlon. Non ho ancora trovato il tempo di studiare a fondo -fforce-mem e -fforce-addr nel kernel.
Per il resto, diffido di qualsiasi cosa cerchi di aumentare la velocitā aumentando troppo le dimensioni. Questo vale anche per il gcc 3.x: maggiore ottimizzazione del codice, maggiore dimensione dei binari ("migliore allineamento dei dati", dicono loro) ==> minore velocitā. Per un motivo molto semplice: maggiori dimensioni == maggiore spreco della preziosa cache L1.
__________________
0: or %edi, %ecx; adc %eax, (%edx); popf; je 0b-22; pop %ebx; fadds 0x56(%ecx); lds 0x56(%ebx), %esp; mov %al, %al
andeqs pc, r1, #147456; blpl 0xff8dd280; ldrgtb r4, [r6, #-472]; addgt r5, r8, r3, ror #12
|