View Full Version : md5
Salve.
Vorrei sapere come viene calcolato l'hash dell'md5, ho già cercato su google di capirne il funzionamento ma non sono riuscito a capirne molto, ora vorrei sapere se qualcuno di voi saprebbe spiegarmi come funziona.
Es. se ho la stringa "ab", come faccio ad ottenere il relativo hash md5, calcolandolo a mano, se qualcuno riesce a spiegarmi dettagliatamente tutti i pasaggi che vengono effetuati per ottenere l'hash, gliene sarò riconoscente.
Grazie in anticipo.
E' un processo estremamente complicato non ti è di nessunaiuto conoscerne tutti i passaggi....
fcorbelli
08-06-2012, 21:22
Lo trovi facilmente su internet.
Se ti interessa a "stragrandissime linee" il messaggio originale, dopo essere stato opportunamente "allungato", viene spezzato in blocchi di 512 bit.
Ognuno di questi blocchi, a sua volta, viene suddiviso in porzioni più piccole, ad ognuna delle quali sono applicate un certo numero di funzioni logiche (composizione di AND, NOT e XOR) che "rimescolano" il contenuto.
Lo trovi facilmente su internet.
Se ti interessa a "stragrandissime linee" il messaggio originale, dopo essere stato opportunamente "allungato", viene spezzato in blocchi di 512 bit.
Ognuno di questi blocchi, a sua volta, viene suddiviso in porzioni più piccole, ad ognuna delle quali sono applicate un certo numero di funzioni logiche (composizione di AND, NOT e XOR) che "rimescolano" il contenuto.
Inanzittutto grazie della risposta, credo di aver capito cosa volevi dire, ma potresti riuscire ad essere un pò più dettagliato?
Grazie ancora.
fcorbelli
09-06-2012, 10:58
Non mi è chiaro se vuoi l'algoritmo in pseudocodice o in codice.
Lo trovi facilmente basta che cerchi qualcosa tipo
"md5 pascal" o quello che vuoi
Ad esempio
http://pascal.sources.ru/crypt/md5asm32.htm
Quello che mi servirebbe è capire il procedimento che viene fatto, partendo da una stringa in input fino ad ottenere l'hash.
fcorbelli
09-06-2012, 12:05
Quello che mi servirebbe è capire il procedimento che viene fatto, partendo da una stringa in input fino ad ottenere l'hash.ti basta leggere il sorgente o guardare direttamente l'algoritmo, ad esempio su wikipedia
http://en.wikipedia.org/wiki/MD5#Pseudocode
e qui
http://tools.ietf.org/html/rfc1321
OK, sto cercando di capire l'algoritmo, che c'è su wikipedia,
nel primo pasaggio vengono dichiarati 2 array(r, k) di lunghezza 64, mentre nel secondo pasaggio non riesco a capire cosa si sta facendo, sapresti spiegarmi cosa è?
non capisco cosa voglia dire questa istruzione ":="
Grazie.
fcorbelli
09-06-2012, 16:51
assegnazione
Grazie, io pensavo chissà cosa volesse dire, adesso però non capisco perchè vengono assegnati proprio quei valori ad r?, hanno qualche significato particolare?
mentre nel pasaggio succesivo c'è questo:
//Use binary integer part of the sines of integers (Radians) as constants:
for i from 0 to 63
k[i] := floor(abs(sin(i + 1)) × (2 pow 32))
end for
il ciclo credo di averlo capito, calcola il seno di (i+1), ne prende il valore assoluto, lo moltiplica per 2^32, elimina tutta la parte decimale, ed infine lo assegna ad k[i]?
Es: i:=0
sin(0 + 1)-->0,017452406437283512819418978516316
abs(0,017452406437283512819418978516316)-->0,017452406437283512819418978516316
0,017452406437283512819418978516316*2^32-->74957514,884632562639401266449305
floor(74957514,884632562639401266449305)-->74957514
k[i]:=74957514
giusto?
perchè mi viene un dubbio sul calcolo del seno, perchè nei commenti c'è scritto qualcosa a riguardo dei radianti, però non ci ho capito molto.
Grazie ancora.
ok, ora ho capito, si calcola il seno di i+1, in radianti che è 0.8414709848, prendo il valore assoluto, lo moltiplico per 2^32 ottenedo: 3614090360,2489131008, arrotondo a 0 decimali: 3614090360, lo converto in esadecimale: D76AA478, ottenedo esattamente quello che c'è nella tabella sul link di wikipedia che mi hai dato, l'unica differenza è che gli all'inizio del valore in esadecimale c'è anche 0x, che non capisco cosa voglia dire.
però non ho ancora capito perchè all'array r vengono assegnati proprio quei valori, inoltre sapresti spiegarmi cosa vuol dire la segiente roba:
//Pre-processing: adding a single 1 bit
append "1" bit to message
/* Notice: the input bytes are considered as bit strings,
where the first bit is the most significant bit of the byte.[37]
In other words: the order of bits in a byte is BIG ENDIAN,
but the order of bytes in a word is LITTLE ENDIAN */
fcorbelli
10-06-2012, 14:46
all'inizio del valore in esadecimale c'è anche 0x, che non capisco cosa voglia dire.Proprio "esadecimale"
inoltre non ho ancora capito perchè nell'array r vengono scelti proprio quei valori.Perchè son così.
In teoria, ma moooolto in teoria, dovrebbero irrobustire da una crittanalisi differenziale, un po' come la scelta delle funzioni fatta a suo tempo (in segreto) per DES.
Non mi è chiaro se vuoi sapere "come" si calcola l'hash o "perchè" lo si calcola così
Grazie ancora, no voglio semplicemente capire come si calcola, mi potresti spiegare cosa significa il pasaggio successivo:
//Pre-processing: adding a single 1 bit
append "1" bit to message
/* Notice: the input bytes are considered as bit strings,
where the first bit is the most significant bit of the byte.
In other words: the order of bits in a byte is BIG ENDIAN,
but the order of bytes in a word is LITTLE ENDIAN */
fcorbelli
11-06-2012, 09:24
Grazie ancora, no voglio semplicemente capire come si calcola, mi potresti spiegare cosa significa il pasaggio successivo:
//Pre-processing: adding a single 1 bit
append "1" bit to message
/* Notice: the input bytes are considered as bit strings,
where the first bit is the most significant bit of the byte.
In other words: the order of bits in a byte is BIG ENDIAN,
but the order of bytes in a word is LITTLE ENDIAN */
La prima parte è il padding, ovvero allungare il messaggio fino a giungere a un multiplo di 512 byte, il che sottostà a regole precise (contiene anche la lunghezza del messaggio, se non ricordo male, è parecchio che non lo insegno più).
Riguardo invece a big e little endian, si tratta della forma di codifica delle parole, ovvero se si memorizzano prima i byte bassi o quelli alti.
E' un retaggio storico di una diatriba nata ai tempi di motorola vs intel (poi portata avanti lato powerpc e così via).
Inanzittutto grazie per la risposta.
Però non credo di aver capito.
Es. se il mio mesaggio è questo:
"Cantami o diva del pelide Achille l'ira funesta" --> 47 byte
ora il messaggio è di 47 byte, quindi ora devo raggiungere una lunghezza di 64 byte, aggiungendo 17 byte?
però mi viene un dubbio 64 non è un sottomultiplo di 512?
e se il messaggio da criptare fosse più lungo di 512 byte, i byte in più vengono ignorati?
inoltre quali byte vengono aggiunti per raggiungere tale lunghezza?
ora forse ho capito:
leggendo su questo sito: http://tools.ietf.org/html/rfc1321 (step 3.1)
nella fase di padding il messaggio viene "imbottito", in modo tale che la lunghezza del massaggio si pari ad 448bit mod 512bit(in altre parole di 448 bit -- >56 byte), quindi il messaggio viene portato ad una lunghezza di 448bit, in modo tale che manchino solo 64 bit perchè il messaggio sia pari a 512 bit, l'imbottitura avviene come segue:
viene prima aggiunto il bit "1", e poi "0" bit fino a raggiungere 448 bit.
giunto?
fcorbelli
15-06-2012, 21:25
Sono multipli di 512 bit, non byte.
La prima fase del padding serve per arrivare all'ultimo chunk cui appendere la lunghezza del messaggio (a 64 bit), per poi avere un messaggio composto esattamente da multipli di 512 bit.
Sono multipli di 512 bit, non byte.
La prima fase del padding serve per arrivare all'ultimo chunk cui appendere la lunghezza del messaggio (a 64 bit), per poi avere un messaggio composto esattamente da multipli di 512 bit.
e no sta volta non ho capito nulla, potresti spiegarti meglio
Grazie in anticipo.=)
fcorbelli
16-06-2012, 15:35
e no sta volta non ho capito nulla, potresti spiegarti meglio
Grazie in anticipo.=)
Bhè in realtà è piuttosto semplice.
I messaggi vengono elaborati a blocchi di 512 bit, e fin qui bene.
Però in coda al messaggio (inteso come flusso di bit) viene appesa la lunghezza del messaggio stesso (in binario, 64 bit).
Quindi avrai qualcosa tipo
<messaggio>.........<pad>............<ultimi 64 bit, lunghezza >
010102010101010 1...0000000[...]00000000000000000000000000111
Gli ultimi 64 bit sono la lunghezza del messaggio (* per inciso come puoi capire non riesci a calcolare hash di più di 2^64 bit di lunghezza, ma in questo caso fa lo stesso, memorizzi comunque i 64 bit della lunghezza)
In sostanza il messaggio è composto da tanti chunk da 512 bit, l'ultimo dei quali ha gli ultimi 64 riservati (=posti alla lunghezza), quindi in realtà ne ha 448 (che sono 512-64) liberi.
Se sono tutti occupati bene, altrimenti li paddi con un "1" e tanti zeri fino ad arrivare a 488, a quel punto ci metti la lunghezza del messaggio (64 bit) e ottieni l'ultimo chunk di 512.
In teoria, ma molto in teoria, questo consente-una volta decodificato il messaggio- di controllare di aver letto tanti byte quanti avrebbero dovuti essere (una sorta di "doppio controllo")
non capisco perchè servono 64 bit per contenere la lunghezza del messaggio, se al massimo il messaggio può essere lungo 448bit, infatti se il messaggio fosse lungo 448 bit, trasformando 448 in binario diventa:111 000 000(9 bit), quindi basterebbere 9 bit per contenere la lunghezza del messaggio?
inotre anlizzando il passo successivo, dentro un ciclo for, c'è un and "b and c"
b = 0xefcdab89
c = 0x98badcfe
come si calcola l'and tra questi 2 valori?
Grazie in anticipo.
pubblico la risposta di fcorbelli sul forum(può tornare utile ad altre persone) che non può rispondere direttamente sul forum:
----------------------------------------------------------------------------------------------------------------------
La prima risposta è relativa al fatto che sono previsti 64 bit per la lunghezza del messaggio.
Ma questo può essere lungo fino a 2^64 bit.
Se consideriamo l'hash di un file d 4gigabyte, si avranno 32 bit a zero e 32 a 1 per la lunghezza.
In altri termini la lunghezza del messaggio è quella TOTALE.
Riguardo alla funzione "and" questa opera in binario.
Si convertono quindi i valori in binario, e poi si opera la moltiplicazione ("E" logico), secondo la tabella della verità
di AND per cui il risultato è 1 se e solo se entrambi gli operandi sono 1.
Nell'esempio, per semplicità, supponiamo
b=$89
c=$fe
b (in binario) vale
10001001
mentre c
11111110
Ora si fa l'AND bit a bit (il cui risultato è 1 se entrambi sono 1)
12345678
10001001 AND
11111110
-------------
1: 1 AND 1 = 1
2: 0 AND 1 = 0
3: 0 AND 1 = 0
4: 0 AND 1 = 0
5: 1 AND 1 = 1
6: 0 AND 1 = 0
7: 0 AND 1 = 0
8: 1 AND 0 = 0
Risultato (se non mi son sbagliato)
10001000
Grazie mille :), ho capito.
ora però sempre riferendomi ad sito da lei linkatomi:http://en.wikipedia.org/wiki/MD5#Pseudocode, nella parte in cui ci sono 2 cicli for annidati, per quanto riguarda il ciclo più interno ho capito che va da 0 a 63, mentre quello esterno non riesco a capire quanto dura...
inoltre all'interno del ciclo più esterno è presente questa istruzione:
b := b + leftrotate((a + f + k[i] + w[g]) , r[i])
cosa vuol dire leftrotate?
Grazie.
risposta di fcorbelli:
--------------------------------------------------------------------------------------------
Il ciclo più esterno dura quanti chunk da 512 bit è lungo il messaggio (dopo il padding)
Se il messaggio è di 1Kbyte, il ciclo sarà eseguito due volte, perchè in ogni elaborazione
(ciclo interno) viene considerato un "pezzetto" di 512 bit.
Tutta la struttura di md5 è orientato ai bit, non ai byte.
la funzione lefrotate è definita
leftrotate (x, c)
return (x << c) binary or (x >> (32-c));
in sostanza è un SHL (shift-left), ovvero sposta verso sinistra tanti bit quanti sono specificati
ad esempio
x = a << 2
significa che x=4a
ma quindi se il messaggio fosse: "a", quindi 1byte(8 bit), effettua solo 1 ciclo esterno?
inoltre non mi è ancora del tutto chiaro il leftrotate.
Grazie ancora. =)
risposta da parte fcorbelli:
-----------------------------------------------------------------------------------------
> ma quindi se il messaggio fosse: "a", quindi 1byte(8 bit), effettua
> solo 1 ciclo esterno?
>
Sì, ma il messaggio non sarebbe di un byte.
Sarebbe in realtà di 512 bit, ove gli ultimi 64 (bit) conterrebbero il
numero binario 8 (che è la lunghezza in bit del messaggio,
attenzione che come detto md5 "pensa" in bit)
> inoltre non mi è ancora del tutto chiaro il leftrotate.
>
> Grazie ancora. =)
Sono funzioni tipiche del linguaggio macchina, sono spostamenti a destra
e sinistra (con o senza riporto) di registri binari.
Avvengono molto velocemente mediante istruzioni-macchina specializzate
In sostanza dato un certo numero binario memorizzato "da qualche parte"
(in realtà un registro della CPU o una cella di memoria),
uno SHIFT sinistro "sposta" la definizione binaria verso sinistra,
appendendo uno 0
Esempio:
numero binario 11001 (25 decimale9
se faccio uno SHIFT sinistro di una posizione ottengo
110010
dove ho aggiunto a destra uno zero, equivalente a fare un 25*2 (e
infatti vale 50 in decimale)
Se faccio uno SHIFT sinistro di due posizioni avrò
1100100 che è 100 in decimale
Discorso analogo per gli shift destri (solo invertiti, sono divisioni
per potenze di due).
---
La ROTAZIONE è come uno spostamento, ma il bit più significativo che
"sborderebbe" viene appeso in coda.
Se abbiamo un numero contenuto in un byte (per semplicità)
11111111 (255) e faccio uno shift sinistro, cosa succede?
diventerebbe
11111110 la il primo uno, quello più a sinistra, "sparirebbe".
Con una rotazione lo piglio e lo "accodo" a destra, nel bit meno
significativo.
In pratica è come avere un qualcosa che fa "scorrere" i bit a sinistra
(o destra) per poi far rientrare quelli
che "uscirebbero"
(non so se si capisce), è una sorta di "rimescola-le-carte"
Devo ammettere che le sue spiegazione sono molto esaustive =).
ora l'ultimo passo:
var char digest[16] := h0 append h1 append h2 append h3 //(expressed as little-endian)
mi sembra di capire che cui h0, h1, h2, h3, vengano concatenati, e salvati dove?, in digest[16], un array di tipo char?
Chill-Out
21-06-2012, 10:07
risposta da parte fcorbelli:
-----------------------------------------------------------------------------------------
> ma quindi se il messaggio fosse: "a", quindi 1byte(8 bit), effettua
> solo 1 ciclo esterno?
>
Sì, ma il messaggio non sarebbe di un byte.
Sarebbe in realtà di 512 bit, ove gli ultimi 64 (bit) conterrebbero il
numero binario 8 (che è la lunghezza in bit del messaggio,
attenzione che come detto md5 "pensa" in bit)
> inoltre non mi è ancora del tutto chiaro il leftrotate.
>
> Grazie ancora. =)
Sono funzioni tipiche del linguaggio macchina, sono spostamenti a destra
e sinistra (con o senza riporto) di registri binari.
Avvengono molto velocemente mediante istruzioni-macchina specializzate
In sostanza dato un certo numero binario memorizzato "da qualche parte"
(in realtà un registro della CPU o una cella di memoria),
uno SHIFT sinistro "sposta" la definizione binaria verso sinistra,
appendendo uno 0
Esempio:
numero binario 11001 (25 decimale9
se faccio uno SHIFT sinistro di una posizione ottengo
110010
dove ho aggiunto a destra uno zero, equivalente a fare un 25*2 (e
infatti vale 50 in decimale)
Se faccio uno SHIFT sinistro di due posizioni avrò
1100100 che è 100 in decimale
Discorso analogo per gli shift destri (solo invertiti, sono divisioni
per potenze di due).
---
La ROTAZIONE è come uno spostamento, ma il bit più significativo che
"sborderebbe" viene appeso in coda.
Se abbiamo un numero contenuto in un byte (per semplicità)
11111111 (255) e faccio uno shift sinistro, cosa succede?
diventerebbe
11111110 la il primo uno, quello più a sinistra, "sparirebbe".
Con una rotazione lo piglio e lo "accodo" a destra, nel bit meno
significativo.
In pratica è come avere un qualcosa che fa "scorrere" i bit a sinistra
(o destra) per poi far rientrare quelli
che "uscirebbero"
(non so se si capisce), è una sorta di "rimescola-le-carte"
Devo ammettere che le sue spiegazione sono molto esaustive =).
ora l'ultimo passo:
var char digest[16] := h0 append h1 append h2 append h3 //(expressed as little-endian)
mi sembra di capire che cui h0, h1, h2, h3, vengano concatenati, e salvati dove?, in digest[16], un array di tipo char?
Comprenderai perfettamente che la sospensione è una misura disciplinare nei confronti di un'utente che ha violato il Regolamento, se per interposta persona pubblichi i PVT oltre a non essere corretto per questioni legate alla privacy, violi tu stesso il Regolamento.
mi scusi Chill-Out, non capisco cosa centri la violazione della privacy, comunque io ho pubblicato le risposte che mi ha mandato fcorbelli, per il semplice fatto, che magari queste materiale potrebbe tornare utile anche ad altre persone.
Dal momento che lei è un moderatore, certamente il suo primo compito è quello di far rispettare il regolamento del forum, ma penso che non si dovrebbe dimenticare che in quanto lei è un moderatore, dovrebbe in primo luogo pensare anche ad un ampliamento dei contenuti del forum stesso, che è quello che ho fatto.
Chill-Out
21-06-2012, 11:23
mi scusi Chill-Out, non capisco cosa centri la violazione della privacy
http://www.hwupgrade.it/forum/regolamento.php
8. PVT: Messaggi privati
Dal momento che lei è un moderatore, certamente il suo primo compito è quello di far rispettare il regolamento del forum, ma penso che non si dovrebbe dimenticare che in quanto lei è un moderatore, dovrebbe in primo luogo pensare anche ad un ampliamento dei contenuti del forum stesso, che è quello che ho fatto.
Pubblicando i messaggi privati di un utente sospeso, di fatto è come bypassare la sospensione.
I contenuti si ampliano applicando le corrette modalità, che non sono certo queste.
...Questo spazio è messo a disposizione degli utenti per impostare discussioni costruttive e utili per tutti i lettori...
non ho fatto altro che seguire questa parte del regolamento.
Pubblicando i messaggi privati di un utente sospeso, di fatto è come bypassare la sospensione.
Non è mia intenzione "bypassare la sospensione".
Chill-Out
21-06-2012, 11:42
non ho fatto altro che seguire questa parte del regolamento.
Non è mia intenzione "bypassare la sospensione".
Il Regolamento è decisamente più articolato, non può essere riassunto estrapolando una frase che di fatto in questo contesto ha poco significato.
Mi ripeto
http://www.hwupgrade.it/forum/showpost.php?p=37675879&postcount=25
che tradotto in parole povere, se sei sospeso non puoi postare e tu non puoi farlo per lui, argomento chiuso.
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.