Torna indietro   Hardware Upgrade Forum > Software > Programmazione

PNY RTX 5080 Slim OC, sembra una Founders Edition ma non lo è
PNY RTX 5080 Slim OC, sembra una Founders Edition ma non lo è
La PNY GeForce RTX 5080 Slim OC si distingue nel panorama delle GPU di fascia alta per il design compatto a due slot, ispirato alla NVIDIA GeForce RTX 5080 Founders Edition. In questo test analizziamo comportamento termico e prestazioni in gioco, valutando se il formato ridotto comprometta o meno l'esperienza complessiva rispetto alle soluzioni più ingombranti presenti sul mercato.
Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei
Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei
HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e le luci LED dinamiche c'è una macchina tecnica costruita attorno allo standard Wi-Fi 7, con velocità teoriche Dual-Band fino a 3,6 Gbps e una copertura fino a 120 m² una volta abbinato il router principale all'extender incluso nel kit
Core Ultra 7 270K Plus e Core Ultra 7 250K Plus: Intel cerca il riscatto ma ci riesce in parte
Core Ultra 7 270K Plus e Core Ultra 7 250K Plus: Intel cerca il riscatto ma ci riesce in parte
Abbiamo provato le nuove CPU Intel Core Ultra 7 270K Plus e Core Ultra 7 250K Plus: più core e ottimizzazioni al funzionamento interno migliorano le prestazioni, anche in virtù di prezzi annunciati interessanti. A questo si aggiungono nuove ottimizzazioni software. Purtroppo, a fronte di prestazioni di calcolo elevate, il quadro rimane incerto nel gaming, dove l'andamento rimane altalenante. Infine, rimane il problema della piattaforma a fine vita.
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 18-04-2010, 23:10   #1
Teo@Unix
Senior Member
 
L'Avatar di Teo@Unix
 
Iscritto dal: Mar 2009
Messaggi: 753
[assembly] divisione

Cerco un piccolo chiarimento...

dando un occhio su come gcc mi traduce l'istruzione C:
Codice:
area = width * height/2
trovo questo:
Codice:
       imul   0xc(%ebp),%edx
       mov    %edx,%eax
       shr    $0x1f,%eax
       add    %edx,%eax
       sar    %eax
non capisco bene come viene fatta la divisione... mi è chiaro imul che moltiplica. Ma non sono sicuro del resto...

grazie.
Teo@Unix è offline   Rispondi citando il messaggio o parte di esso
Old 18-04-2010, 23:50   #2
Kenger
Member
 
Iscritto dal: Aug 2005
Messaggi: 168
Hai preso l'esempio sbagliato per vedere come si fa la divisione.
La divisione per due viene ottimizzata dal compilatore come uno shift a destra. Se fai una divisione per qualsiasi numero che non sia 2 vedi una divisione vera.
Kenger è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2010, 09:15   #3
Teo@Unix
Senior Member
 
L'Avatar di Teo@Unix
 
Iscritto dal: Mar 2009
Messaggi: 753
ok, so che viene fatta con uno shift, ma non ho capito in questo caso cosa viene fatto.
In particolare io vedo
uno shift di EAX >> 31
poi ad EAX viene aggiunto EDX
e poi sar io ero convinto avesse due operandi invece qui ne ha uno.

Il mio obiettivo è capire questo esempio.
Teo@Unix è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2010, 11:36   #4
cdimauro
Senior Member
 
L'Avatar di cdimauro
 
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
Quote:
Originariamente inviato da Teo@Unix Guarda i messaggi
ok, so che viene fatta con uno shift, ma non ho capito in questo caso cosa viene fatto.
In particolare io vedo
uno shift di EAX >> 31
Prende il bit del segno del risultato della moltiplicazione e lo mette in EAX. Quindi EAX = 0 -> risultato positivo, EAX = 1 -> risultato negativo.
Quote:
poi ad EAX viene aggiunto EDX
Esatto. Quindi ci sono due casi:
Risultato positivo -> EAX = risultato (nessun cambiamento)
Risultato negativo -> EAX = risultato + 1.
Quote:
e poi sar io ero convinto avesse due operandi invece qui ne ha uno.
Sì, lo shift di 1 è implicito.
Quote:
Il mio obiettivo è capire questo esempio.
Il problema è che non si possono usare shift aritmetici (quindi con segno) senza tener conto di alcuni casi speciali.

Per i positivi, come vedi non cambia nulla. Il problema è coi negativi.

Se invece sono negativi, in particolare nel caso in oggetto bisogna controllare se per caso il risultato da dividere per 2 vale -1 oppure è < -1.

Se vale -1 sappiamo che la divisione deve valere 0. Infatti in questo caso EAX = risultato + 1 = -1 + 1 = 0. E lo shift ritorna correttamente 0.

Se invece è < -1, lo shift aritmetico a destra ricopierà sempre il bit del segno, per cui il risultato rimarrà sempre negativo.
Esempio: -2 + 1 = -1 sar 1 = -1.
-3 + 1 = -2 sar 1 = -1.
-4 + 1 = -3 sar 1 = -2. E così via.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro
@LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro
Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys
cdimauro è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2010, 12:10   #5
Teo@Unix
Senior Member
 
L'Avatar di Teo@Unix
 
Iscritto dal: Mar 2009
Messaggi: 753
aa.. ora dovrei esserci, si potevo immaginare che ove c'era sar era implicito 1.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Se invece è < -1, lo shift aritmetico a destra ricopierà sempre il bit del segno, per cui il risultato rimarrà sempre negativo.
Esempio: -2 + 1 = -1 sar 1 = -1.
-3 + 1 = -2 sar 1 = -1.
-4 + 1 = -3 sar 1 = -2. E così via.
ho capito, tutto viene fatto per mentenere il segno in modo corretto.
Infatti... infatti.... se uso variabili unsigned int.... la traduzione è ben diversa.
Non c'è tutto il procedimento sopra detto...

Vorrei chiederti un'altra cosa... poco chiara..

La riga di codice C che ho riportato fa parte di una funzione che poi ritorna
il valore area.

Noto che le ultime due istruzioni prima di ret apparentemente non servono a nulla...
Codice:
....
0x0000002e <triangle+46>:       imul   0xc(%ebp),%edx
0x00000032 <triangle+50>:       mov    %edx,%eax
0x00000034 <triangle+52>:       shr    $0x1f,%eax
0x00000037 <triangle+55>:       add    %edx,%eax
0x00000039 <triangle+57>:       sar    %eax
0x0000003b <triangle+59>:       mov    %eax,-0x4(%ebp) // << --- ??
0x0000003e <triangle+62>:       mov    -0x4(%ebp),%eax // << --- ??
0x00000041 <triangle+65>:       leave
0x00000042 <triangle+66>:       ret
ti ringrazio.
Teo@Unix è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2010, 14:08   #6
cdimauro
Senior Member
 
L'Avatar di cdimauro
 
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
Quote:
Originariamente inviato da Teo@Unix Guarda i messaggi
aa.. ora dovrei esserci, si potevo immaginare che ove c'era sar era implicito 1.

ho capito, tutto viene fatto per mentenere il segno in modo corretto.
Infatti... infatti.... se uso variabili unsigned int.... la traduzione è ben diversa.
Non c'è tutto il procedimento sopra detto...
Esatto. Con gli unsigned il codice è banale: dopo la mul (che è unsigned), seguirà sicuramente a ruota una semplice shr.
Quote:
Vorrei chiederti un'altra cosa... poco chiara..

La riga di codice C che ho riportato fa parte di una funzione che poi ritorna
il valore area.

Noto che le ultime due istruzioni prima di ret apparentemente non servono a nulla...
Codice:
....
0x0000002e <triangle+46>:       imul   0xc(%ebp),%edx
0x00000032 <triangle+50>:       mov    %edx,%eax
0x00000034 <triangle+52>:       shr    $0x1f,%eax
0x00000037 <triangle+55>:       add    %edx,%eax
0x00000039 <triangle+57>:       sar    %eax
0x0000003b <triangle+59>:       mov    %eax,-0x4(%ebp) // << --- ??
0x0000003e <triangle+62>:       mov    -0x4(%ebp),%eax // << --- ??
0x00000041 <triangle+65>:       leave
0x00000042 <triangle+66>:       ret
ti ringrazio.
A naso l'istruzione inutile è la seconda move, per ovvi motivi.

La prima sembra sia necessaria per conservare il valore in qualche variabile. Se si tratta di una variabile, allora anche questa mov è del tutto inutile, in quanto la leave provvederà a ripulire lo stack dallo spazio allocatato per le variabili locali, e a questo punto vuol dire che il risultato viene ritornato usando il registro eax.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro
@LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro
Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys
cdimauro è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2010, 14:16   #7
Teo@Unix
Senior Member
 
L'Avatar di Teo@Unix
 
Iscritto dal: Mar 2009
Messaggi: 753
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Esatto. Con gli unsigned il codice è banale: dopo la mul (che è unsigned), seguirà sicuramente a ruota una semplice shr.
esattamente.

Quote:
A naso l'istruzione inutile è la seconda move, per ovvi motivi.

La prima sembra sia necessaria per conservare il valore in qualche variabile. Se si tratta di una variabile, allora anche questa mov è del tutto inutile, in quanto la leave provvederà a ripulire lo stack dallo spazio allocatato per le variabili locali, e a questo punto vuol dire che il risultato viene ritornato usando il registro eax.
Questo rimane un pò un mistero, ma non è ora molto importante... il codice sorgente che ho usato per il test è una sola funzione senza main, ma non credo che questo c'entri.

Codice:
int triangle(int width,int height) {
	int area;
	area = width * height/2;
	return(area);
}
grazie.
Teo@Unix è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2010, 14:43   #8
||ElChE||88
Senior Member
 
Iscritto dal: Dec 2003
Messaggi: 4907
E' semplice: hai compilato senza ottimizzazioni e il compilatore ha "tradotto" il codice alla lettera usando la variabile locale che non era affatto necessaria.

Codice:
mov    %eax,-0x4(%ebp)
mov    -0x4(%ebp),%eax
La prima sposta il risultato nella variabile locale area.
La seconda sposta area in eax per usarlo come valore di ritorno.
Sono entrambe inutili perché il risultato in eax c'era già ed area essendo locale non servirà più, e infatti se compili con -O2 (o se scrivi la funzione senza usare variabili locali) non le mette.

Ultima modifica di ||ElChE||88 : 19-04-2010 alle 14:49.
||ElChE||88 è offline   Rispondi citando il messaggio o parte di esso
Old 19-04-2010, 14:58   #9
Teo@Unix
Senior Member
 
L'Avatar di Teo@Unix
 
Iscritto dal: Mar 2009
Messaggi: 753
Quote:
Originariamente inviato da ||ElChE||88 Guarda i messaggi
E' semplice: hai compilato senza ottimizzazioni e il compilatore ha "tradotto" il codice alla lettera usando la variabile locale che non era affatto necessaria.

Codice:
mov    %eax,-0x4(%ebp)
mov    -0x4(%ebp),%eax
La prima sposta il risultato nella variabile locale area.
La seconda sposta area in eax per usarlo come valore di ritorno.
Sono entrambe inutili perché il risultato in eax c'era già ed area essendo locale non servirà più, e infatti se compili con -O2 (o se scrivi la funzione senza usare variabili locali) non le mette.
E' vero! E' esattamente come dici. Non ci ho pensato.
L'ottimizzazione ha ridotto molto l'assembly, pertanto per controllare la traduzione del codice direi che è sempre meglio ottimizzare. Tutto chiaro. Vi ringrazio.
Teo@Unix è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


PNY RTX 5080 Slim OC, sembra una Founders Edition ma non lo è PNY RTX 5080 Slim OC, sembra una Founders Editio...
Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei Wi-Fi 7 con il design di una vetta innevata: ecc...
Core Ultra 7 270K Plus e Core Ultra 7 250K Plus: Intel cerca il riscatto ma ci riesce in parte Core Ultra 7 270K Plus e Core Ultra 7 250K Plus:...
PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu PC Specialist Lafité 14 AI AMD: assemblat...
Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Recensione Nothing Phone 4(a): sempre iconico ma...
L'AI agentica potrebbe trasformare Inter...
Qualcomm lancerà due chip per sma...
Xiaomi dà i numeri: ecco come &eg...
AMD annuncia Ryzen 9 9950X3D2 Dual Editi...
CyrusOne avvia la costruzione del suo pr...
Cloud in crescita, ma l’adozione dell’IA...
OpenAI cancella l'adult mode di ChatGPT:...
Google Search Live arriva in Italia: la ...
MacBook Air 15'' con chip M4 (2025) crol...
Ora è possibile trasferire file t...
Apple domina con il MacBook Neo: i lapto...
Arriva la nuova gamma di PC Dell Pro per...
DJI Avata 360: la recensione del primo d...
Il browser di Samsung arriva su Windows,...
I satelliti AI Sat Mini per i datacenter...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 22:10.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v