PDA

View Full Version : problema modello predittivo


data_miner
24-06-2009, 14:30
ciao, sono nuovo del forum, non sapevo precisamente dove postare visto che la questione coinvolge piu' materie, quindi chiedo scusa in anticipo se ho cannato sezione. Avrei bisogno di un vostro aiuto per il problema che vi spiego subito.

Ho un dataset di record così composti:
7 variabili, x1,...,x7 tutte numeriche intere positive, due variabili x8=f(x1,...,x7) e x9=g(x3,...,x7) e una dicotomica x10.

Le funzioni f e g non sono note a priori, quello che serve a me è un modello che mi permetta di prevedere x10 nei due casi:
in relazione a {x1,...,x8} e in relazione a {x3,...,x9}.

Avevo pensato per le funzioni f e g di utilizzare una regressione lineare multipla per stimare x8 e x9 e poi predire x10 in base alla differenza tra il valore predetto di x8 (x9) e il valore effettivo. Questo però mi porterebbe a non tenere in conto per le previsioni i valori del training set della x10...

Avevo pensato anche alla regressione logistica, ma come applicarla?? Altre idee?

Spero di essere stato sufficientemente chiaro, grazie mille a chi mi aiuterà (o cercherà di farlo :) )

P.S. Dimenticavo: che software utilizzare per le analisi?? Il dataset è disponibile sia in csv,xls,mdb...