View Full Version : [statistica] i dadi mi perseguitano!
jumpermax
01-02-2006, 11:31
Dunque fate conto di avere un dado con f facce. Ad ogni lancio ogni faccia ha pari probabilità di uscita 1/f
Ora supponiamo di effettuare una serie di N lanci
La probabilità che esca sempre la stessa faccia è 1/f^N e siamo tutti d'accordo Si tratta di una serie di eventi non correlati tra loro
La probabilità che non esca mai una specifica faccia è esprimibile come (1-1/f)^N e siamo tutti d'accordo anche qua. (spero)
La probabilità che esca almeno una volta una specifica faccia quindi è pari alla probabilità che non si verifichi che non esca mai una specifica faccia. Detto in termini matematici che è più chiaro
1-(1-1/f)^N Se non ricordo male questa è la formula di Cardenas.
Veniamo al casino generale:
Data una serie di lanci N qual è la probabilità che esca almeno h volte una specifica faccia? :help:
Dunque fate conto di avere un dado con f facce. Ad ogni lancio ogni faccia ha pari probabilità di uscita 1/f
Ora supponiamo di effettuare una serie di N lanci
La probabilità che esca sempre la stessa faccia è 1/f^N e siamo tutti d'accordo Si tratta di una serie di eventi non correlati tra loro
La probabilità che non esca mai una specifica faccia è esprimibile come (1-1/f)^N e siamo tutti d'accordo anche qua. (spero)
La probabilità che esca almeno una volta una specifica faccia quindi è pari alla probabilità che non si verifichi che non esca mai una specifica faccia. Detto in termini matematici che è più chiaro
1-(1-1/f)^N Se non ricordo male questa è la formula di Cardenas.
Veniamo al casino generale:
Data una serie di lanci N qual è la probabilità che esca almeno h volte una specifica faccia? :help:
Ciao,ma dimmi devi andare al casinò o devi giocare a risiko x caso :D :D :D
Data una serie di lanci N qual è la probabilità che esca almeno h volte una specifica faccia? :help:
Conviene calcolare la probabilità che esca esattamente h volte una stessa faccia, poi h+1 e così via fino a N. La probabilità che esca esattamente h volte una faccia è la binomiale:
p(h) = B(N,h) * 1/f^h * (1 - 1/f)^(N-h)
dove:
B(N,h) = N! / (h! (N-h)!)
Esiste una formula più compatta basata sulla distribuzione cumulativa della binomiale negativa, ma coinvolge la funzione beta regolarizzata e francamente non ho voglia di approfondire :D
http://en.wikipedia.org/wiki/Negative_binomial_distribution#Cumulative_distribution_function
jumpermax
02-02-2006, 00:45
Conviene calcolare la probabilità che esca esattamente h volte una stessa faccia, poi h+1 e così via fino a N. La probabilità che esca esattamente h volte una faccia è la binomiale:
p(h) = B(N,h) * 1/f^h * (1 - 1/f)^(N-h)
dove:
B(N,h) = N! / (h! (N-h)!)
Esiste una formula più compatta basata sulla distribuzione cumulativa della binomiale negativa, ma coinvolge la funzione beta regolarizzata e francamente non ho voglia di approfondire :D
http://en.wikipedia.org/wiki/Negative_binomial_distribution#Cumulative_distribution_function
uh banus sei sempre una certezza, grazie mille! :D
Ero convintissimo di aver risolto la questione poi mi sono accorto che in realtà ho bisogno di sapere
Data una serie di lanci N qual è la probabilità che ci sia una faccia che esca almeno h volte ? Il problema sembra simile ma disgraziatamente è diverso.
Presa p(h)
p(k) = B(N,k) * 1/f^k * (1 - 1/f)^(N-k)
s(h)=sum (k=0..h-1,p(k)) mi da la probabilità che una faccia esca meno di h volte.
Ho trovato un sicuro maggiorante dato da f*s(h) ma non sono riuscito a fare il conto esatto, non posso considerare (1-s(h))^f perchè mica sono eventi scorrelati!
Data una serie di lanci N qual è la probabilità che ci sia una faccia che esca almeno h volte ?
In effetti è diverso, e anche più impestato :D
Se chiamiamo s(h) (per semplicità) la probabilità di h o più uscite di una determinata faccia (così i calcoli sono più semplici :p) allora la tua formula:
P(h) = f*s(h)
è esatta se h è maggiore di N/2. Breve motivazione: i problemi ci sono per le sequenze che soddisfano più di una volta la condizione "la faccia x è uscita almeno h volte", ma se h è maggiore di N/2 una faccia che soddisfa questa condizione esclude necessariamente le altre.
Per gli altri casi invece la situazione è decisamente complicata :p
Dovresti sottrarre a mano tutti i "doppioni". Con la multinomiale ci riesci di sicuro, ma a occhio temo che esca un algoritmo davvero lungo...
Un altro modo (sfruttando il fatto che le probabilità sono uguali - 1/f) è "contare" i casi corretti usando il calcolo combinatorio, ma adesso è tardi e non riesco a trovare nessun metodo buono :p
:rotfl: :rotfl:
Ho scritto la formula impestatissima e crasha il database :D
Comunque mi ricordo un f = 2^b con b da 1 a 63, N = 1000000 e h = 20 giusto? :D
La morale (se non hai fatto in tempo a leggere il mio messaggio) è che con b abbastanza alto devi sommare fino a 50000 termini che a loro volta sono sommatorie... non escludo che troncando la somma a un certo punto esca una buona approssimazione ma non ci giurerei :D
Sarebbe da provare con modelli approssimati, quelli che mi vengono in mente sono Poisson e normale. Se trovo la voglia provo a buttare giù qualcosa di preciso :p
jumpermax
02-02-2006, 21:17
azz mi è costato caro sto recupero di freeman.... fortuna che avevo la copia del mio messaggio di stamattina :D
In effetti è diverso, e anche più impestato :D
Se chiamiamo s(h) (per semplicità) la probabilità di h o più uscite di una determinata faccia (così i calcoli sono più semplici :p) allora la tua formula:
P(h) = f*s(h)
è esatta se h è maggiore di N/2. Breve motivazione: i problemi ci sono per le sequenze che soddisfano più di una volta la condizione "la faccia x è uscita almeno h volte", ma se h è maggiore di N/2 una faccia che soddisfa questa condizione esclude necessariamente le altre.
Per gli altri casi invece la situazione è decisamente complicata :p
Dovresti sottrarre a mano tutti i "doppioni". Con la multinomiale ci riesci di sicuro, ma a occhio temo che esca un algoritmo davvero lungo...
Un altro modo (sfruttando il fatto che le probabilità sono uguali - 1/f) è "contare" i casi corretti usando il calcolo combinatorio, ma adesso è tardi e non riesco a trovare nessun metodo buono :p
ti quantifico il problema per farti capire il mio stato di disperazione... i dadi hanno 2^b facce con b libero di variare fino a 63, N tipicamente è attorno ad un milione e h è circa 20... ad intuito la formula che ho scritto dovrebbe essere un upper bound.
Per essere esatti detta s(h) la probabilità che una determinata faccia compaia <=h volte (mi è comodo rappresentare questa) la probabilità che tutte le faccie compaiano meno di h la posso esprimere come
s(h)^f
e quindi la probabilità che cerco sarebbe
1-s(h)^f
oppure posso considerare nulla la probabilità dell'evento congiunto dei singoli 1-s(h) e quindi sommare
(1-s(h))*f
Di sicuro
(1-s(h)) =<P(h)=<(1-s(h))*f
Viene fuori direttamente dalla legge della somma...
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.