Torna indietro   Hardware Upgrade Forum > Software > Programmazione

DLSS 4.5: con Dynamic Frame Generation e MFG 6X NVIDIA alza la posta
DLSS 4.5: con Dynamic Frame Generation e MFG 6X NVIDIA alza la posta
DLSS 4.5 introduce Dynamic Multi Frame Generation e MFG 6X, permettendo fino a cinque frame generati per ogni frame renderizzato. I test su Cyberpunk 2077 e 007 First Light mostrano forti incrementi di FPS e riduzione della latenza su RTX 5090 Laptop. Migliorano fluidità, stabilità e qualità visiva.
Plaud NotePin S, il registratore IA si fa indossabile (ma è facile da perdere)
Plaud NotePin S, il registratore IA si fa indossabile (ma è facile da perdere)
Quattro modi di indossarlo, stessa app del Plaud Note Pro e integrazione con il desktop. Il registratore IA da indossare di Plaud eccelle in mobilità, ma resta vincolato all'abbonamento ed è facile da perdere
Redmi Watch 6 in prova: lo smartwatch con ampio display da 2000 nit a meno di 100 euro
Redmi Watch 6 in prova: lo smartwatch con ampio display da 2000 nit a meno di 100 euro
Xiaomi ha portato Redmi Watch 6 anche sul mercato italiano, puntando su un display AMOLED da 2,07 pollici con picco di luminosità a 2000 nit, frame in alluminio da 9,9mm e un'autonomia dichiarata di 12 giorni. Lo smartwatch gira su HyperOS 3 e integra GPS, Bluetooth 5.4 e oltre 150 sport mode. Il tutto a meno di 100 euro
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 07-12-2006, 16:52   #1
fabbius69
Senior Member
 
Iscritto dal: Feb 2003
Città: Verona
Messaggi: 1890
cicli nidificati: è più veloce un p4 2,4 Ghz o un E6300?

Spesso uso dei programmi in ms-dos con molti cicli nidificati per fare dei calcoli matematici, ora posseggo un pentium 4 da 2,4 Ghz (18x133), con molti programmi implementate da me ci mettono circa 40 minuti per completare il run, ora se acquisto un nuovo pc con il processone E6300 avendo una velocità di 1,866 Ghz teoricamente ci dovrei mettere di più??? oppure essendo un core 2 duo con 2 mb L2 potrebbe andare più veloce????

Mi serve una risposta, ho paura di sbagliare processore per il mio futuro pc
fabbius69 è offline   Rispondi citando il messaggio o parte di esso
Old 07-12-2006, 17:22   #2
mad_hhatter
Senior Member
 
L'Avatar di mad_hhatter
 
Iscritto dal: Oct 2006
Messaggi: 1105
intanto lascia perdere la pura frequenza di clock: quello che conta è il numero di istruzioni per ciclo di clock e il core 2 duo è sicuramente più efficiente del p4... a titolo di cronaca ho un fisso p4 2.6GHz e un portatile con pentium M 1.86GHz (quindi precedente al core 2 duo): tempo fa ho scritto un programma che conteneva algoritmi di geometria computazionale... risultato: lo stesso problema veniva risolto dal pentium M in META' tempo rispetto al pentium 4 (poco meno di 1 minuto per im PM, poco più di 2 minuti il p4)... ovvio, sono dati un po' alla caxxo, ma significativi

in più sicuramente col core 2 duo hai ram e fsb più veloci
mad_hhatter è offline   Rispondi citando il messaggio o parte di esso
Old 07-12-2006, 17:41   #3
fabbius69
Senior Member
 
Iscritto dal: Feb 2003
Città: Verona
Messaggi: 1890
Grazie
fabbius69 è offline   Rispondi citando il messaggio o parte di esso
Old 08-12-2006, 15:18   #4
jappilas
Senior Member
 
L'Avatar di jappilas
 
Iscritto dal: Apr 2003
Città: Genova
Messaggi: 4747
Quote:
Originariamente inviato da mad_hhatter
intanto lascia perdere la pura frequenza di clock: quello che conta è il numero di istruzioni per ciclo di clock e il core 2 duo è sicuramente più efficiente del p4... a titolo di cronaca ho un fisso p4 2.6GHz e un portatile con pentium M 1.86GHz (quindi precedente al core 2 duo): tempo fa ho scritto un programma che conteneva algoritmi di geometria computazionale... risultato: lo stesso problema veniva risolto dal pentium M in META' tempo rispetto al pentium 4 (poco meno di 1 minuto per im PM, poco più di 2 minuti il p4)...
siccome il pentium M non ha inerentemente un' efficienza media doppia rispetto a quella dei un processore netburst di frequenza superiore , direi che hai beccato una situazione peculiare...
sarebbe interessante avere un' idea più precisa dell' algoritmo, e delle condizioni di contorno (compilatore, profilo di ottimizzazione usato, ottimizzazioni nel codice, eccetera) per fare un po' di profiling
__________________
Jappilas is a character created by a friend for his own comic - I feel honored he allowed me to bear his name
Saber's true name belongs to myth - a Heroic Soul out of legends, fighting in our time to fullfill her only wish
Let her image remind of her story, and of the emotions that flew from my heart when i assisted to her Fate

Ultima modifica di jappilas : 08-12-2006 alle 15:21.
jappilas è offline   Rispondi citando il messaggio o parte di esso
Old 08-12-2006, 18:22   #5
mad_hhatter
Senior Member
 
L'Avatar di mad_hhatter
 
Iscritto dal: Oct 2006
Messaggi: 1105
Quote:
Originariamente inviato da jappilas
siccome il pentium M non ha inerentemente un' efficienza media doppia rispetto a quella dei un processore netburst di frequenza superiore , direi che hai beccato una situazione peculiare...
sarebbe interessante avere un' idea più precisa dell' algoritmo, e delle condizioni di contorno (compilatore, profilo di ottimizzazione usato, ottimizzazioni nel codice, eccetera) per fare un po' di profiling
come ho specificato, quello che ho postato non voleva e non poteva essere un benchmark, voleva solo dimostrare che un PM PUO' essere più veloce di un P4 anche se quest'ultimo ha frequenza di clock superiore. In ogni caso, l'architettura del PM è sicuramente più efficiente di quella del P4, mi pare in rete ci siano benchmark a supporto di questa tesi.
mad_hhatter è offline   Rispondi citando il messaggio o parte di esso
Old 08-12-2006, 21:03   #6
jappilas
Senior Member
 
L'Avatar di jappilas
 
Iscritto dal: Apr 2003
Città: Genova
Messaggi: 4747
Quote:
Originariamente inviato da mad_hhatter
come ho specificato, quello che ho postato non voleva e non poteva essere un benchmark, voleva solo dimostrare che un PM PUO' essere più veloce di un P4 anche se quest'ultimo ha frequenza di clock superiore. In ogni caso, l'architettura del PM è sicuramente più efficiente di quella del P4, mi pare in rete ci siano benchmark a supporto di questa tesi.
non hai bisogno di dimostrarmelo, so che il livello di efficienza normalizzato a pari frequenza è maggiore, e anche il perchè
ma proprio per questo mi chiedevo se nel tuo programma ad esempio fossero presenti molti salti, che un p4 soffirrebbe più di un PM e giustificherebbero una disparità prestazionale maggiore rispetto a quella che (se non erro) sussiste tra i rispettivi livelli di efficienza su codice normale...
__________________
Jappilas is a character created by a friend for his own comic - I feel honored he allowed me to bear his name
Saber's true name belongs to myth - a Heroic Soul out of legends, fighting in our time to fullfill her only wish
Let her image remind of her story, and of the emotions that flew from my heart when i assisted to her Fate

Ultima modifica di jappilas : 08-12-2006 alle 21:28.
jappilas è offline   Rispondi citando il messaggio o parte di esso
Old 08-12-2006, 21:43   #7
mad_hhatter
Senior Member
 
L'Avatar di mad_hhatter
 
Iscritto dal: Oct 2006
Messaggi: 1105
Quote:
Originariamente inviato da jappilas
non hai bisogno di dimostrarmelo, so che il livello di efficienza normalizzato a pari frequenza è maggiore, e anche il perchè
mi spieghi il perchè perfavore (se non ci vuole troppo)?

Quote:
Originariamente inviato da jappilas
ma proprio per questo mi chiedevo se nel tuo programma ad esempio fossero presenti molti salti, che un p4 soffirrebbe più di un PM e giustificherebbero una disparità prestazionale maggiore rispetto a quella che (se non erro) sussiste tra i rispettivi livelli di efficienza su codice normale...
come ho detto, il test era alla cazzo perchè troppe cose erano diverse: java 1.4.2 sul p4, java5 sul pM, sistema (win xp sp2) molto ben tenuto sul portatile, sistema (win xp sp2) un po' trasandato sul p4... troppe variabili da normalizzare per poter fare un confronto serio, ma il risultato era, per me, abbastanza degno di nota... l'algoritmo in questione me lo ricordo a spanne... MI PARE che, presa in input una bitmap e trasformata in una matrice di char, l'algoritmo trovasse i bordi dei singoli oggetti in essa contenuti e li orientasse in senso antiorario sfruttando maschere di pixel 3x3 e sì, forse faceva molti salti, ma vado troppo a memoria

Ultima modifica di mad_hhatter : 08-12-2006 alle 22:20.
mad_hhatter è offline   Rispondi citando il messaggio o parte di esso
Old 09-12-2006, 00:09   #8
jappilas
Senior Member
 
L'Avatar di jappilas
 
Iscritto dal: Apr 2003
Città: Genova
Messaggi: 4747
Quote:
Originariamente inviato da mad_hhatter
mi spieghi il perchè perfavore (se non ci vuole troppo)?
elementi strutturali del P4 frutto di una certa impostazione di progetto e in qualche caso di compromessi, quali:
il decoder a monte della cache L1I , ma non superscalare (quindi, una sequenza di istruzioni x86 non decodificate, deve attraversare la pipeline del front end /decoder una alla volta - laddove un A64 carica e decodifica, producendo anche un paio di risc-ops per ognuna, 3 istruzioni X86 per ciclo e Core fino a 4);
la cache L1I execution trace, che pur essendo progettata per una dimensione della singola linea e del buffer di uscita, pari a 6 ( in termini di microops) , quelle che effettivamente può produrre diventano 3 sul northwood (*) e poi 4 sul prescott per via di una riorganizzazione della ETC (16k uops in linee da 4 piuttosto che 12k in linee da 6), sempre però pari o al di sotto delle microistruzioni risc-type che vengono inviate a valle del decoder in architetture come quelle più recenti, in cui l' esecuzione e in certi casi lo scheduling, avviene su gruppi di microistruzioni aggregate (che però non vengono bufferizzate ma, ridecodificate qualora il codice debba essere rieseguito) ... quindi con una ipc media tendenzialmente maggiore;
la rom a sequenziazione di microcodice, che per le istruzioni X86 complesse bypassa la ETC e il decoder per alimentare una singola ALU dedicata (quindi se incontra un' istruzione X86 di tipo complesso P4 diventa per qualche ciclo un processore inorder non superscalare)
l' unità sse/floating point a una sola via ma a doppia frequenza come le alu intere, e interleaved (secondo alcuni documenti, su altri è riportata una sola porta tra l' unità e la reservation station) - cosa che inficia particolarmente l' esecuzione di sezioni di codice basato su istruzioni X87 (floating point legacy) e MMX, rispetto agli altri processori , e il modo per ottimizzare l' esecuzione di SW che debba effettuare operazioni matematiche o anche di manipolazione di blocchi di dati (forzando l' uso delle SSE)
Poi si aggiungono quelle che potrebbero essere le conseguenze ("bolle") del maggior numero di stadi nell' intervallo tra le fasi di trace ed execute in caso di salto condizionale e dell' assenza dello stadio di ripristino (presente sugli AMD, non mi pare però su Core)...
tutto semplificando e a meno di memory fading del mio neurone ( esaminai netburst qualche anno fa, il fading è in agguato), ma spero di aver dato almeno un' idea
Quote:
come ho detto, il test era alla cazzo perchè troppe cose erano diverse: java 1.4.2 sul p4, java5 sul pM, sistema (win xp sp2) molto ben tenuto sul portatile, sistema (win xp sp2) un po' trasandato sul p4... troppe variabili da normalizzare per poter fare un confronto serio, ma il risultato era, per me, abbastanza degno di nota...
in effetti sì ... quantomeno per le prestazioni dell' "insieme A" a confronto con quelle dell' "insieme B" con "insieme" l' abbinamento di "ambiente" e archiettura) , anche se in genere un test è tanto più indicativo quanto più omologo è l' "ambiente" per il primo e per il secondo soggetto
__________________
Jappilas is a character created by a friend for his own comic - I feel honored he allowed me to bear his name
Saber's true name belongs to myth - a Heroic Soul out of legends, fighting in our time to fullfill her only wish
Let her image remind of her story, and of the emotions that flew from my heart when i assisted to her Fate

Ultima modifica di jappilas : 10-12-2006 alle 12:12.
jappilas è offline   Rispondi citando il messaggio o parte di esso
Old 09-12-2006, 12:19   #9
mad_hhatter
Senior Member
 
L'Avatar di mad_hhatter
 
Iscritto dal: Oct 2006
Messaggi: 1105
Quote:
Originariamente inviato da jappilas
elementi strutturali del P4 frutto di una certa impostazione di progetto e in qualche caso di compromessi, quali:
il decoder a monte della cache L1I , ma non superscalare (quindi, una sequenza di istruzioni x86 non decodificate, deve attraversare la pipeline del front end /decoder una alla volta - laddove un A64 carica e decodifica 3 istruzioni X86 per ciclo e Core fino a 4);
la cache L1I execution trace, che pur essendo progettata per una dimensione della singola linea e del buffer di uscita, pari a 6 ( in termini di microops) , quelle che effettivamente può produrre diventano 3 sul northwood (*) e poi 4 sul prescott per via di una riorganizzazione della ETC (16k uops in linee da 4 piuttosto che 12k in linee da 6), sempre però pari o al di sotto delle microistruzioni risc-type che vengono inviate a valle del decoder in architetture come quelle più recenti in cui l' esecuzione e in certi casi lo scheduling, avviene su gruppi di microistruzioni aggregate (che però non vengono bufferizzate ma, ridecodificate qualora il codice debba essere rieseguito) ... quindi con una ipc media tendenzialmente maggiore;
la rom a sequenziazione di microcodice, che per le istruzioni X86 complesse bypassa la ETC e il decoder per alimentare una singola ALU dedicata (quindi se incontra un' istruzione X86 di tipo complesso P4 diventa per qualche ciclo un processore inorder non superscalare)
l' unità sse/floating point a una sola via ma a doppia frequenza come le alu intere, e interleaved (secondo alcuni documenti, su altri è riportata una sola porta tra l' unità e la reservation station) - cosa che inficia particolarmente l' esecuzione di sezioni di codice basato su istruzioni X87 (floating point legacy) e MMX, rispetto agli altri processori , e il modo per ottimizzare l' esecuzione di SW che debba effettuare operazioni matematiche o anche di manipolazione di blocchi di dati (forzando l' uso delle SSE)
Poi si aggiungono quelle che potrebbero essere le conseguenze del maggior numero di stadi nell' intervallo tra le fasi di trace ed execute in caso di salto condizionale ...
tutto semplificando e a meno di memory fading del mio neurone ( esaminai netburst qualche anno fa, il fading è in agguato), ma spero di aver dato almeno un' idea
in effetti sì ... quantomeno per le prestazioni dell' "insieme A" a confronto con quelle dell' "insieme B" con "insieme" l' abbinamento di "ambiente" e archiettura) , anche se in genere un test è tanto più indicativo quanto più omologo è l' "ambiente" per il primo e per il secondo soggetto
ti ringrazio, mi hai dato ben più di "un'idea" anche perché molte delle cose che hai detto le comprendo a livello intuitivi ma non ne ho conoscenza approfondita (tranquillo, non ti sto chiedendo di spiegarmi l'architettura di una cpu moderna reale, so dove reperire le info dettagliate, se e quando avrò tempo )

per il test, è appunto un tentativo di confrontare mele e pere quindi ha poco significato, solo che la differenza prestazionale era tale da permettermi di ricordarmela
mad_hhatter è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


DLSS 4.5: con Dynamic Frame Generation e MFG 6X NVIDIA alza la posta DLSS 4.5: con Dynamic Frame Generation e MFG 6X ...
Plaud NotePin S, il registratore IA si fa indossabile (ma è facile da perdere) Plaud NotePin S, il registratore IA si fa indoss...
Redmi Watch 6 in prova: lo smartwatch con ampio display da 2000 nit a meno di 100 euro Redmi Watch 6 in prova: lo smartwatch con ampio ...
Mad Catz M.M.O. 7+: lo stesso DNA del R.A.T. 8+ ADV, ma con molti più pulsanti Mad Catz M.M.O. 7+: lo stesso DNA del R.A.T. 8+ ...
Radeon RX 9070 GRE, AMD la porta in tutto il mondo | Recensione Gigabyte Gaming OC Radeon RX 9070 GRE, AMD la porta in tutto il mon...
Il Regno Unito chiederà a Google ...
"Consigliami uno smartphone che sia...
Wizz Air non segue l'esempio di Ryanair:...
GeForce RTX 5060 Ti a poco più di...
Alcuni Stati americani vogliono bloccare...
Il lato apocalittico della guerra in Ucr...
Intel amplia il supporto di Binary Optim...
L'IA nata a Roma che studia, legge, asco...
Il re decaduto delle criptovalute punta ...
Il 2026 rischia di essere l'anno pi&ugra...
I server Gigabyte con architetture AMD,...
Apple chiude l'era Intel: macOS Golden G...
TIM, rincari da luglio: come evitare l'a...
WWDC 26: Il Digital Markets Act dell'Uni...
WWDC 26: Apple Intelligence rivoluziona ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 08:32.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v