PDA

View Full Version : [C++] Generazione numeri random-dubbi


Albitexm
18-05-2010, 22:56
Ho provato a scrivere una semplice funzione che genera dei numeri random (pseudo).
Leggendo i Vs. post sulla generazione di numeri random (ZioSilvio) e lo stesso help del compilatore VC++, apprendo che è meglio far precedere "srand( (unsigned)time( NULL ) );" alla funzione "rand() per inizializzare il seme del generatore, ogni volta che viene eseguita la funzione.
Ho provato quindi a eseguire il codice, inserendolo in un loop "for", per vedere il risultato dei numeri generati. Stranamente (per me..), la funzione srand la devo inserire all'esterno del loop, altrimenti ottengo sempre lo stesso numero:
"
for (int i=1; i<=100; i++)
{
srand( (unsigned)time( NULL ) );
int A;
A = rand()%5;
cout<<" "<<A<<" ";
}
"
mi restituisce 100 volte lo stesso numero, che cambia ogni volta che eseguo
il debug. Mentre:
"
srand( (unsigned)time( NULL ) );
for (int i=1; i<=100; i++)
{
int A;
A = rand()%5;
cout<<" "<<A<<" ";
}
"
mi restituisce una serie di 100 numeri casuali (o pseudo) tra 0 e 4.
Domanda: se io devo scrivere una semplice funzione, che mi generi un numero casuale, e questa durante il programma verrà invocata sicuramente più volte, devo inserire la funzione srand?

fero86
19-05-2010, 02:43
é un comportamento normalissimo: srand() va chiamata nel programma una volta per tutte e prima di qualunque chiamata rand().

il motivo é che srand() resetta il generatore di numeri casuali col seme specificato, e a paritá di seme rand() genera la stessa identica sequenza infinita; il motivo per cui il tuo primo programma genera 100 numeri uguali é che tu per 100 volte resetti il generatore con lo stesso seme (il processore procede velocemente, il risultato della time non fa in tempo a cambiare con solo 100 iterazioni, peró cambia ogni volta che riavvii il debugger).

il secondo programma invece funziona correttamente perché é quello il modo giusto di usare il generatore di numeri casuali del C: una sola srand() all'inizio e poi tutte le rand() che ti pare.

un'ultima cosa: non si direbbe che tu abbia letto i post di ZioSilvio, altrimenti non useresti l'operatore modulo :D
come spiegato eloquentemente dalla guida di ZioSilvio, l'operatore modulo cambia la distribuzione della rand() rendendo leggermente piu probabili i valori iniziali del codominio; questo avviene sempre tranne quando il secondo operando del modulo é un divisore di RAND_MAX. per mantenere la distribuzione uniforme devi convertire a double, moltiplicare per 5, dividere per RAND_MAX, e arrotondare (arrotondare, non troncare, quindi il cast non va bene) a int.

Albitexm
19-05-2010, 22:06
é un comportamento normalissimo: srand() va chiamata nel programma una volta per tutte e prima di qualunque chiamata rand().

il motivo é che srand() resetta il generatore di numeri casuali col seme specificato, e a paritá di seme rand() genera la stessa identica sequenza infinita; il motivo per cui il tuo primo programma genera 100 numeri uguali é che tu per 100 volte resetti il generatore con lo stesso seme (il processore procede velocemente, il risultato della time non fa in tempo a cambiare con solo 100 iterazioni, peró cambia ogni volta che riavvii il debugger).

il secondo programma invece funziona correttamente perché é quello il modo giusto di usare il generatore di numeri casuali del C: una sola srand() all'inizio e poi tutte le rand() che ti pare.



Quindi se ho capito bene: devo dichiarare le funzioni "random" senza "srand", poi dopo nella "main", prima d'invocare qualsiasi funzione "random", devo inizializzare il seme del generatore con "srand", una e un'unica volta?

nota: per quanto riguarda il discorso della distribuzione dei numeri, avevo letto il post di ZioSilvio, ma questa era una prova di scrittura della funzione, dove non sono ancora interessato alla qualità del risultato ma solo alla verifica del funzionamento.

fero86
19-05-2010, 22:42
in realtá non é vietato chiamare srand altre volte dopo la prima, peró dovresti almeno assicurarti che il seme sia cambiato perché altrimenti rigeneri la stessa sequenza che hai generato fino a quel momento, che é quello che succedeva a te. inoltre chiamare srand() piu volte é inutile secondo me perché una volta che l'hai chiamata puoi generare infiniti numeri pseudocasuali apparentemente scorrelati tra di loro; intuitivamente se la chiami altre volte ottieni lo stesso risultato ma col rischio che se il seme non é cambiato generi la stessa sequenza di prima e perdi la pseudocasualitá.

tutti questi discorsi vanno letti nell'ottica che tipicamente l'implementazione di rand() non é sicura: avendo una manciata di numeri iniziali della sequenza é possibile predire i successivi senza troppa difficoltá (purtroppo non conosco i dettagli ma c'é molta letteratura in merito).

un generatore pseudocasuale crittograficamente sicuro é un generatore che genera una sequenza tale che dati i primi n numeri di essa é impossibile predire correttamente in tempo polinomiale il numero successivo con probabilitá non trascurabile* rispetto ad n. di norma la rand() non viene implementata con algoritmi crittograficamente sicuri.

*non ricordo con esattezza la definizione di funzione trascurabile, spero di non sbagliare nel dire che é una funzione che da un certo indice in poi converge piu rapidamente di qualunque polinomio di n. intuitivamente é una funzione che al crescere di n diventa molto piccola e insignificante, almeno rispetto ad n :D

Albitexm
20-05-2010, 22:38
tutti questi discorsi vanno letti nell'ottica che tipicamente l'implementazione di rand() non é sicura: avendo una manciata di numeri iniziali della sequenza é possibile predire i successivi senza troppa difficoltá (purtroppo non conosco i dettagli ma c'é molta letteratura in merito).

:D

Dal mio punto di vista, la sicurezza, la possibilità di predire la sequenza non m'interessa. Infatti io non devo usare la generazione dei numeri per scopi di crittografia. Per il mio programma sono interessato che i numeri vengano generati con una distribuzione uniforme, o comunque ragionevolmente uniforme.
Infatti il programma a cui stò lavorando è un tool di analisi scacchistico.
Analisi "Montecarlo". E' evidente che se i numeri a cui io associo delle mosse sono generati non uniformemente, ma con una prevalenza di numeri bassi, io avrò una prevalenza di mosse "corte". Tutto stà a vedere, in percentuale quanto è spostata la distribuzione uniforme dei numeri. Al limite potrei lavorare anche sull'elaborazione dei risultati nella statistica finale.
Grazie delle utili informazioni.