Quote:
Originariamente inviato da megamitch
Io ho fatto diverse prove con Gemini e altre IA da browser ed ho notato frequenti allucinazioni per task che dovrebbero essere il pane quotidiano per un assistente:
- spesso sbaglia a dirmi che giorno č oggi o che ore sono
- ho ideato una specie di mio personale test: chiedo alla IA se "in pausa pranzo una certa biblioteca č aperta" e spesso sbaglia
Quindi boh come si fa a fidarsi ?
|
Ma non solo. Fa una marea di minchiate pure con task super standard.