View Single Post
Old 19-11-2006, 19:06   #91
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da Lorekon
semi-OT
è giusto ma è sbagliato.
se si assume che la grandezza si distribuisce in modo cosiddetto normale (cioè secondo una gaussiana) e si vuole stimare la media, si usa la formula per la stima della grandezza statistica detta "media campionaria". Per stimarla, preso un campione casuale dalla popolazione totale, si può usare una stima per intervallo anzichè una stima puntuale, ovvero l'intervallo di confidenza, che è l'intervallo in cui, con un certo grado di sicurezza a scelta (95 %, 99 %, 99,99 %) la media "vera" della poplazione è contenuta.
Per la stima della media si usa la distribuzione "t di Student" con un certo numero di gradi di libertà, che sono un valore proprio di ogni curva di distribuzione chi-quadro (insieme al "livello di protezione" ovvero alla probabilità di non sbagliare che si è scelto, cioè appunto 95 %, 99 %, etc...). Questo perchè si può dimostrare che se prendo una popolazione, la campiono TOT volte con campioni di grandezza nota, le medie dei campioni si distribuiscono proprio cno la curva del "t di Student".
In ogni caso, poichè si assume che la distribuzione delle opinioni sia "normale", non si specifica se nel 5 % di possibilità di errore ammesso il valore sia SUPERIORE o INFERIORE all'intervallo di confidenza, ma solo che è ESTERNO ad esso, ovvero che l'intervallo costruito sul campione non azzecca la descrizione della popolazione totale.

Quindi in teoria il 5 % di errore comprende un 2,5 % di possibilità che la stima della popolazione nel governo sia inferiore al 46 %, e un 2,5 % di possibilità che essa sia superiore al 46 %

EDIT si distribuisce secondo t di Student, non secondo chi.quadro.
EDIT2 se qualcuno che ne sa legge, mi corregga perchè sto rileggendo e non è affatto chiaro come l'ho scritto, e non sono manco sicuro di non aver fatto errori
Beh, sai, la statistica per me è molto lontana (1994-1996, per intenderci... ). Per il lavoro che faccio (ricercatore), vedo tutti i giorni medie, varianze, tendenze, R quadro per determinare se una tendenza è significativa. Oppure per vedere se un aumento o diminuzione è significativa (per esempio una diminuzione del volume di placche da slerosi multipla, per vedere se il farmaco che stiamo testando funziona effettivamente), si calcola la variazione media (ad esempio in media diminuisce), poi si calcola la deviazione standard di questa media e la si divide per la radice quadrata del numero di soggetti. Quella è la deviazione standard della media. Perciò se il numero di "campioni" è sufficiente, si può avere una stima della media. Ora qui sono dati del tipo si/no, ma si può comunque fare questo scherzo: dando al si 100% e no un 0%, si calcola media e deviazione standard su questi 1000 risultati. Poi si divide la deviazione standard per radice di 1000 (circa 31,6). La deviazione standard ottenuta è quella della media. Ad esempio avremo che il gradimento è 45+-1% (dove la deviazione standard magari era 0,3% e con tre deviazioni standard copri il 99% dei casi). Allora io pubblico 46% con un intervallo di convfidenza del 99,5% (perchè c'è l'1% di probabilità di sbagliare, di cui 0,5 in eccesso e 0,5 in difetto)...
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline   Rispondi citando il messaggio o parte di esso