Il mio prof di Sistemi Esperti diceva che il numero di neuroni dei layer intermedi corrisponde circa alla complessità del problema. L'errore della rete neurale ha un minimo in corrispondenza del numero ottimale (sto parlando di apprendimento supervisionato). E' una definizione un po' vaga, ma nel caso di classificazione il numero di neuroni corrisponde circa al numero di classi.
Scusami se non sono chiaro ma è più di un anno che ho visto queste cose