Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Recensione Nothing Phone (4a) Pro: finalmente in alluminio, ma dal design sempre unico
Recensione Nothing Phone (4a) Pro: finalmente in alluminio, ma dal design sempre unico
Nothing Phone (4a) Pro cambia pelle: l'alluminio unibody sostituisce la trasparenza integrale, portando una solidità inedita. Sotto il cofano troviamo uno Snapdragon 7 Gen 4 che spinge forte, mentre il display è quasi da top dig amma. Con un teleobiettivo 3.5x e la Glyph Matrix evoluta, è la prova di maturità di Carl Pei. C'è qualche compromesso, ma a 499EUR la sostanza hardware e la sua unicità lo rendono un buon "flagship killer" in salsa 2026
WoW: Midnight, Blizzard mette il primo, storico mattone per l'housing e molto altro
WoW: Midnight, Blizzard mette il primo, storico mattone per l'housing e molto altro
Con Midnight, Blizzard tenta il colpaccio: il player housing sbarca finalmente su Azeroth insieme a una Quel'Thalas ricostruita da zero. Tra il dramma della famiglia Ventolesto e il nuovo Prey System, ecco com'è la nuova espansione di World of Warcraft
Ecovacs Goat O1200 LiDAR Pro: la prova del robot tagliaerba con tagliabordi integrato
Ecovacs Goat O1200 LiDAR Pro: la prova del robot tagliaerba con tagliabordi integrato
Nuova frontiera per i robot tagliaerba, con Ecovacs GOAT O1200 LiDAR Pro che riconosce l'ambiente in maniera perfetta, grazie a due sensori LiDAR, e dopo la falciatura può anche rifinire il bordo con il tagliabordi a filo integrato
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 22-02-2011, 13:54   #1
cndcnd
Junior Member
 
Iscritto dal: Feb 2011
Messaggi: 13
processore/mother borard più veloce per spostamento arrays?

Ciao a tutti,

Sono un ingegnere e mi occupo di modelli informatici dello sviluppo embrionale. Ho scritto un programma che, appunto, simula lo sviluppo embrionale di una serie di organi e parti anatomiche. La caratteristica principale del programma è la manipolazione di enormi array tridimensionali, che devono essere spostati da una parte all’altra della memoria.

Satvo cercando di capire qual è la migliore piattaforma hardware per questo tipo di applicazioni. Finora ho lavorato con una CPU “general purpose” (Intel Core 2 Quad Processor Q9550), che tuttavia pone dei limiti alla dimensione della griglia. 80 x 80 x 80 è la dimensione massima: andando oltre i tempi di calcolo diventano eccessivi (le realizzazioni seguenti:

http://www.artembryo.org/xx_Osx/zx_brain_dust_x0.avi
http://www.artembryo.org/xx_Osx/zx_stomach1_dust_x2.avi

ad esempio, richiedono in media 4-5 giorni di elaborazione per essere completate).

Mi chiedevo quindi se esistono dei processori paralleli (il programma lo è) più adatti allo scopo.

Grazie,

Alessandro
cndcnd è offline   Rispondi citando il messaggio o parte di esso
Old 22-02-2011, 14:05   #2
WarSide
Senior Member
 
Iscritto dal: Oct 2008
Messaggi: 10574
Prima di parlare di hardware, domanda fondamentale: come hai scritto il programma? Java? C?

Hai controllato per bene gli algoritmi per cercare di ridurne la complessità?

Comunque sicuramente avresti vantaggi orientandoti su una piattaforma server multi socket e multicore (con eventuale tri/quad channel per le memorie)

Ultima modifica di WarSide : 22-02-2011 alle 14:08.
WarSide è online   Rispondi citando il messaggio o parte di esso
Old 22-02-2011, 15:33   #3
cndcnd
Junior Member
 
Iscritto dal: Feb 2011
Messaggi: 13
Il programma è scritto in C++ e penso che sia abbastanza ottimizzato (a scapito della chiarezza). Il maggior beneficio l'ho avuto compattando i dati in modo da minimizzare il numero di miss della cache, che nel q9550 è 12 MB (almeno è quello che penso).

Potresti essere più specifico sulla piattaforma hardware? Lo I7-990 potrebbe essere un'opzione? Con quale scheda madre e quale memoria?

Grazie
cndcnd è offline   Rispondi citando il messaggio o parte di esso
Old 22-02-2011, 17:15   #4
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da cndcnd Guarda i messaggi
Ciao a tutti,

Sono un ingegnere e mi occupo di modelli informatici dello sviluppo embrionale. Ho scritto un programma che, appunto, simula lo sviluppo embrionale di una serie di organi e parti anatomiche. La caratteristica principale del programma è la manipolazione di enormi array tridimensionali, che devono essere spostati da una parte all’altra della memoria.

Satvo cercando di capire qual è la migliore piattaforma hardware per questo tipo di applicazioni. Finora ho lavorato con una CPU “general purpose” (Intel Core 2 Quad Processor Q9550), che tuttavia pone dei limiti alla dimensione della griglia. 80 x 80 x 80 è la dimensione massima: andando oltre i tempi di calcolo diventano eccessivi (le realizzazioni seguenti:

http://www.artembryo.org/xx_Osx/zx_brain_dust_x0.avi
http://www.artembryo.org/xx_Osx/zx_stomach1_dust_x2.avi

ad esempio, richiedono in media 4-5 giorni di elaborazione per essere completate).

Mi chiedevo quindi se esistono dei processori paralleli (il programma lo è) più adatti allo scopo.

Grazie,

Alessandro
Ciao
Scusami se ti sembrerà una checklist:
Che liberia di math hai utilizzato?
Hai provato a vettorizzare gli accessi alla memoria? E' possibile? Il kernel principale in cosa consiste ?(provo ad indovinare moltiplicazioni ed addizioni di matrici non sparse ?)
Se è possibile fare tutto ciò, allora ti conviene fare un porting su cuda\opencl. Altrimenti un sistema 2p opteron 6100.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita

Ultima modifica di Pihippo : 22-02-2011 alle 17:26.
Pihippo è offline   Rispondi citando il messaggio o parte di esso
Old 22-02-2011, 17:28   #5
WarSide
Senior Member
 
Iscritto dal: Oct 2008
Messaggi: 10574
Quote:
Originariamente inviato da Pihippo Guarda i messaggi
Ciao
Scusami se ti sembrerà una checklist:
Che liberia di math hai utilizzato?
Hai provato a vettorizzare gli accessi alla memoria? E' possibile? Il kernel principale in cosa consiste ?(provo ad indovinare moltiplicazioni ed addizioni di matrici non sparse ?)
Se è possibile fare tutto ciò, allora ti conviene fare un porting su cuda\opencl. Altrimenti un sistema 2p opteron 6100.
quoto
WarSide è online   Rispondi citando il messaggio o parte di esso
Old 23-02-2011, 09:37   #6
cndcnd
Junior Member
 
Iscritto dal: Feb 2011
Messaggi: 13
No, figurati. Il programma è compilato con gcc con libreria matematica standard (-lm) e calcolo parallelo openmp.

Il “kernel” del programma è rappresentato da operazioni di “proliferazione cellulare” di forma ellissoidale, in cui i voxel di un ellissoide vengono colorati con un colore specifico. Il programma utilzza un algoritmo genetico per sperimentare diverse combinazioni di tali operazioni e trovare quella che produce il risultato migliore. Di conseguenza effettua un numero molto grande di queste operazioni. Per avere un’idea, puoi immaginare una griglia tridimensionale 100x100x100 in cui continuamente ellissoidi diversi per dimensione e orientazione vengono colorati e cancellati. L’operazione effettuata sul singolo voxel è invece banale (un int che cambia valore).

Vettorizzare gli accessi alla memoria? Come si fa? Le mie conoscenze informatiche purtroppo non sono elevatissime :-(

Secondo te è possibile ottenere una consulenza specifica? (anche a pagamento ovviamente). A chi potrei rivolgermi?

Grazie,

Alessandro
cndcnd è offline   Rispondi citando il messaggio o parte di esso
Old 23-02-2011, 10:17   #7
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da cndcnd Guarda i messaggi
No, figurati. Il programma è compilato con gcc con libreria matematica standard (-lm) e calcolo parallelo openmp.

Il “kernel” del programma è rappresentato da operazioni di “proliferazione cellulare” di forma ellissoidale, in cui i voxel di un ellissoide vengono colorati con un colore specifico. Il programma utilzza un algoritmo genetico per sperimentare diverse combinazioni di tali operazioni e trovare quella che produce il risultato migliore. Di conseguenza effettua un numero molto grande di queste operazioni. Per avere un’idea, puoi immaginare una griglia tridimensionale 100x100x100 in cui continuamente ellissoidi diversi per dimensione e orientazione vengono colorati e cancellati. L’operazione effettuata sul singolo voxel è invece banale (un int che cambia valore).

Vettorizzare gli accessi alla memoria? Come si fa? Le mie conoscenze informatiche purtroppo non sono elevatissime :-(

Secondo te è possibile ottenere una consulenza specifica? (anche a pagamento ovviamente). A chi potrei rivolgermi?

Grazie,

Alessandro
Ciao
Molto interessante come programma e ricerca.
Comunque ti devo delle scuse poichè non mi son spiegato per nulla.
Con vettorizzare gli accessi alla memoria, intendevo massimizzare (come appunto in un vettore) la bw, ovvero caricare tutta la roba che ti serve in un singolo accesso e ridurre al minimo eventuali ritorni alla ram. Non è facilissimo è probabilmente mi son spiegato male pure io, ed è altamente probabile che abbia sbagliato a capire qualcosina .
Comunque qui c'è qualcosina in più:
http://developer.amd.com/documentati...e-Study_2.aspx
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline   Rispondi citando il messaggio o parte di esso
Old 23-02-2011, 11:30   #8
Athlon
Senior Member
 
Iscritto dal: Oct 1999
Messaggi: 3780
Un buon aiuto a capire il problema puo' venire se mentre fai girare i programmi fai un monitoraggio dell' uso delle risorse.

Ad esempio hai controllato se per caso quando all' aumentare della dimesione della griglia non stai andando in swap?

Se il tuo algoritmo e' parallelizzabile piu' che puntare ad una sola CPU putente ti conviene puntare su tante macchine piu' economiche.

Anche l'idea di usare i processori grafici non e' male , pero' considera che sono efficienti se riesci a creare una subroutine completamente eseguibile dal processore grafico , mettere un po' di istruzioni cuda sparse nel codice non aiuta, anzi il continuo cambio di contenso e' molto penalizzante.


A breve dovrebe uscire Bulldozzer di AMD che per calcoli come il tuo risulta imarazzantemente veloce.
__________________
CIAO FABRIZIO .. CORRI TRA LE NUVOLE COME FOSSERO DUNE
Athlon è offline   Rispondi citando il messaggio o parte di esso
Old 24-02-2011, 11:21   #9
cndcnd
Junior Member
 
Iscritto dal: Feb 2011
Messaggi: 13
grazie ragazzi per il vostro aiuto. Nel frattempo ho scoperto un paio di cazzate (tra cui l'inizializzazione di un array assolutamente inutile) che portavano via un 30% del tempo ... Ci sono sicuramente dei margini di miglioramento anche sul programma ...
cndcnd è offline   Rispondi citando il messaggio o parte di esso
Old 24-02-2011, 13:55   #10
WarSide
Senior Member
 
Iscritto dal: Oct 2008
Messaggi: 10574
Quote:
Originariamente inviato da cndcnd Guarda i messaggi
grazie ragazzi per il vostro aiuto. Nel frattempo ho scoperto un paio di cazzate (tra cui l'inizializzazione di un array assolutamente inutile) che portavano via un 30% del tempo ... Ci sono sicuramente dei margini di miglioramento anche sul programma ...
Inserisci dei checkpoint nel codice, profilalo per bene e lavora per ridurre la complessità dove possibile
WarSide è online   Rispondi citando il messaggio o parte di esso
Old 25-02-2011, 18:03   #11
cndcnd
Junior Member
 
Iscritto dal: Feb 2011
Messaggi: 13
oltre al processore (opteron, pensavo di prendere un 6140 con 8 core), avete qualche suggerimento anche per il resto del sistema (scheda madre, memoria) ?
cndcnd è offline   Rispondi citando il messaggio o parte di esso
Old 25-02-2011, 18:09   #12
WarSide
Senior Member
 
Iscritto dal: Oct 2008
Messaggi: 10574
Quote:
Originariamente inviato da cndcnd Guarda i messaggi
oltre al processore (opteron, pensavo di prendere un 6140 con 8 core), avete qualche suggerimento anche per il resto del sistema (scheda madre, memoria) ?
Se non vuoi andare su sistemi preassemblati (es. dell / hp), dai una occhiata ai prodotti Tyan o Supermicro

Le ram vengono di conseguenza: prendi quelle certificate per la mobo che sceglierai.
WarSide è online   Rispondi citando il messaggio o parte di esso
Old 25-02-2011, 18:59   #13
troppotardi
Senior Member
 
L'Avatar di troppotardi
 
Iscritto dal: Oct 2005
Messaggi: 1631
un I7-990 e 24gb di ram non bastano...?


KArl,
__________________
troppotardi è offline   Rispondi citando il messaggio o parte di esso
Old 25-02-2011, 19:03   #14
WarSide
Senior Member
 
Iscritto dal: Oct 2008
Messaggi: 10574
Quote:
Originariamente inviato da troppotardi Guarda i messaggi
un I7-990 e 24gb di ram non bastano...?


KArl,
Sconsiglio caldamente l'immondizia di livello consumer, soprattutto se si devono fare calcoli intensivi è meglio orientrasi su prodotti enterprise

Poi c'è da dire che a certi livelli quasi costa meno la ram ecc rispetto a quella non ecc (fascia consumer).

@cndcnd: se devi prendere mobo/cpu per server dai una occhiata anche agli store tedeschi/olandesi, che in italia o sei una azienda o ti fanno una rapina a mano armata
WarSide è online   Rispondi citando il messaggio o parte di esso
Old 25-02-2011, 23:36   #15
troppotardi
Senior Member
 
L'Avatar di troppotardi
 
Iscritto dal: Oct 2005
Messaggi: 1631
E' facile Sconsigliare... proponi degli esempi invece!


KArl,
__________________

Ultima modifica di troppotardi : 28-02-2011 alle 10:05.
troppotardi è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Recensione Nothing Phone (4a) Pro: finalmente in alluminio, ma dal design sempre unico Recensione Nothing Phone (4a) Pro: finalmente in...
WoW: Midnight, Blizzard mette il primo, storico mattone per l'housing e molto altro WoW: Midnight, Blizzard mette il primo, storico ...
Ecovacs Goat O1200 LiDAR Pro: la prova del robot tagliaerba con tagliabordi integrato Ecovacs Goat O1200 LiDAR Pro: la prova del robot...
Recensione Samsung Galaxy S26+: sfida l'Ultra, ma ha senso di esistere? Recensione Samsung Galaxy S26+: sfida l'Ultra, m...
Zeekr X e 7X provate: prezzi, autonomia fino a 615 km e ricarica in 13 minuti Zeekr X e 7X provate: prezzi, autonomia fino a 6...
DENZA debutta in Europa: Z9GT e D9 porta...
Steam potrebbe presto integrare un siste...
Claude Managed Agents in public beta: ad...
Ring Videocitofono Cablato + Telecamera ...
Windows 10, il supporto ESU viene esteso...
Motorola edge 60 neo a soli 251€: tripla...
Bollette più leggere? Octopus Ene...
Muse Spark è qui: Meta abbandona ...
Microsoft testa su Xbox Insiders la poss...
Climatizzatore 12000 BTU A++ con Wi-Fi a...
La crisi delle memorie farà ricca Samsun...
Il ventilatore Dyson che puoi indossare:...
Insta360 presenta Snap, lo schermo selfi...
Razer Kishi V2 a soli 59,99€ su Amazon: ...
Dallo scantinato di Jobs al NeXT: apre l...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 10:37.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v