|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Senior Member
Iscritto dal: Jan 2004
Città: ROMA
Messaggi: 2055
|
[MySQL] Ottimizzazione di una ricerca nel DB [RISOLTO]
Salve a tutti,
ho un problema. Ho una 30ina di tabelle, e dato un nome (ID) in tutte queste 30 tabelle che sono sottotabelle di un'altra, vorrei sapere a quale sottotabella appartiene. Al momento ho scritto una funzione (Java) che mi fa la scansione di ogni tabella, e quando trova che quel nome è contenuto nella tabella "i", mi restituisce quell'indice (identificativo di una di quelle 30 tabelle). Ora, se ci sono poche tuple a tabella la cosa è fattibile, ma se ci sono 1000 tuple a tabella, nel caso peggiore, posso avere un costo O(30000). Voi cosa mi consigliate per ottimizzare la cosa? Ultima modifica di fbcyborg : 31-01-2010 alle 23:26. |
|
|
|
|
|
#2 |
|
Senior Member
Iscritto dal: May 2004
Città: Londra (Torino)
Messaggi: 3692
|
Ti consiglio di leggere le viste di sistema che contengono le strutture del db.
In particolare dovrai cercare la vista che contiene le Chiavi Straniere. prova a cercare tra queste Codice:
SELECT * FROM information_schema.SCHEMATA S; For constraints and foreign keys also; SELECT * FROM information_schema.TABLE_CONSTRAINTS T; For everything else check this queries; SELECT * FROM information_schema.CHARACTER_SETS C; SELECT * FROM information_schema.COLLATION_CHARACTER_SET_APPLICABILITY C; SELECT * FROM information_schema.COLLATIONS C; SELECT * FROM information_schema.COLUMN_PRIVILEGES C; SELECT * FROM information_schema.`COLUMNS` C; SELECT * FROM information_schema.KEY_COLUMN_USAGE K; SELECT * FROM information_schema.PROFILING P; SELECT * FROM information_schema.ROUTINES R; SELECT * FROM information_schema.SCHEMA_PRIVILEGES S; SELECT * FROM information_schema.STATISTICS S; SELECT * FROM information_schema.TABLE_PRIVILEGES T; SELECT * FROM information_schema.`TABLES` T; SELECT * FROM information_schema.TRIGGERS T; SELECT * FROM information_schema.USER_PRIVILEGES U; SELECT * FROM information_schema.VIEWS V;
__________________
Se pensi che il tuo codice sia troppo complesso da capire senza commenti, e' segno che molto probabilmente il tuo codice e' semplicemente mal scritto. E se pensi di avere bisogno di un nuovo commento, significa che ti manca almeno un test. |
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Jan 2004
Città: ROMA
Messaggi: 2055
|
Innanzitutto ti ringrazio, ma mi devi scusare perché non ho mai usato quel database e i valori in esso contenuti.
Ti faccio un esempio per spiegare la mia situazione, sebbene credo che sia chiara nonostante ciò. Ho una tabella (per esempio) MAGAZZINO, così fatta: Codice:
+--------------+--------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +--------------+--------------+------+-----+---------+-------+ | NOME | varchar(30) | NO | PRI | | | | QUANTITA | float(10,2) | YES | | NULL | | +--------------+--------------+------+-----+---------+-------+ Codice:
+-------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+-------------+------+-----+---------+-------+ | NOME | varchar(30) | NO | PRI | NULL | | +-------+-------------+------+-----+---------+-------+ Ora, in questo momento se voglio sapere se il materiale "materiale" è in una delle 30 sottotabelle, me le scandisco tutte e 30. Tu sicuramente mi hai suggerito qualcosa dal quale dovrei "carpire" i link fra una tabella e un'altra, quindi se non ho capito male mi dovrebbe bastare esaminare la tabella MAGAZZINO + qualche tabella in information_schema. Il problema è che non ho la minima idea di come fare, e non saprei dove andare a mettere il naso. L'unica soluzione che mi viene in mente è quella di aggiungere un attributo (in un'altra tabella che ora non c'entra nulla, ma dalla quale è partito tutto) che mi memorizzi il tipo di materiale, per ogni materiale, e recuperare il nome della tabella di appartenenza da lì. Ma prima cercavo altre soluzioni. |
|
|
|
|
|
#4 |
|
Senior Member
Iscritto dal: May 2004
Città: Londra (Torino)
Messaggi: 3692
|
Database pessimamente progettato.
Comunque ti basta una query di questo tipo SELECT 'TabellaA' FROM MaterialeA WHERE Nome='quellochecerco' UNION ALL SELECT 'TabellaB' FROM MaterialeB WHERE Nome='quellochecerco' UNION ALL SELECT 'TabellaC' FROM MaterialeC WHERE Nome='quellochecerco' .... UNION ALL SELECT 'TabellaZ' FROM MaterialeZ WHERE Nome='quellochecerco' Una volta lanciata questa query ti restituira' il nome della tabella/e che contiene questo materiale. Se c'e' stata almeno l'accortezza di mettere un indice sulla colonna Nome su ciascuna tabella, l'operazione ha costo O(N Log N). Se i record sono 30.000, anche su ciascuna tabella, e' un costo ridicolo. Resta la regola che Java, o qualsiasi altro linguaggio di programmazione che userai per interrogare il DB, deve lanciare le query di ricerca. Non va bene invece leggere tutto il database e scorrere i dati in memoria con Java.
__________________
Se pensi che il tuo codice sia troppo complesso da capire senza commenti, e' segno che molto probabilmente il tuo codice e' semplicemente mal scritto. E se pensi di avere bisogno di un nuovo commento, significa che ti manca almeno un test. |
|
|
|
|
|
#5 | |||
|
Senior Member
Iscritto dal: Jan 2004
Città: ROMA
Messaggi: 2055
|
Questo lo dici tu. Scusa ma probabilmente, non sapendo quali sono le specifiche del progetto e le esigenze del committente non puoi dire questo. A questo punto mi piacerebbe sapere come l'avresti progettato tu un database che richiede una "supertabella" e "n sottotabelle".
Quote:
Quote:
Quote:
Grazie!!!! |
|||
|
|
|
|
|
#6 | ||
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
No, lo dice il buon senso.
Quote:
Quote:
Poi questa suddivisione in n sottotabelle mi puzza non poco. Se sono tutte uguali io avrei usato una tabella unica. C'è ancora oggi gente che crede che dividere dati dello stesso tipo in più tabelle aiuti le prestazioni. Evidentemente non hanno idea di come si struttura un database né tanto meno come funziona "a regime".
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
||
|
|
|
|
|
#7 |
|
Senior Member
Iscritto dal: Jan 2004
Città: ROMA
Messaggi: 2055
|
Boh, allora si vede che i professori dei corsi di Basi di dati e Sistemi di Gestione di Basi di Dati, nonché di Progetto di Basi di dati che ho seguito in questi anni di Ingegneria Informatica non ci capiscono niente.
Andrò presto a lamentarmi! Comunque ho provato questo sistema e non funziona: Codice:
SELECT 'TabellaA' FROM MaterialeA WHERE Nome='quellochecerco' UNION ALL SELECT 'TabellaB' FROM MaterialeB WHERE Nome='quellochecerco' UNION ALL SELECT 'TabellaC' FROM MaterialeC WHERE Nome='quellochecerco' .... UNION ALL SELECT 'TabellaZ' FROM MaterialeZ WHERE Nome='quellochecerco' Non funziona almeno provando la query da sola, senza UNION ALL. AH, e per la precisione: quelle "30 tabelle" NON sono tutte uguali, alcune hanno campi in più. Per questo sono state fatte. Ultima modifica di fbcyborg : 31-01-2010 alle 10:09. |
|
|
|
|
|
#8 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Non c'è bisogno di fare la vittima. La normalizzazione, comunque, dovresti averla studiata.
Nel tuo caso la tabella MAGAZZINO la farei così: Codice:
ID INTEGER NOT NULL AUTO_INCREMENT Nome VARCHAR(30) NOT NULL Quantita DECIMAL(10,2) In questo modo eseguire query che coinvolgono i campi comuni è più semplice e immediato. Le tabelle MATERIALEX avranno soltanto: Codice:
IDMagazzino INTEGER NOT NULL Per gli indici, oltre a Nome li metterai sui campi su cui vengono fatte ricerche oppure ordinamenti più spesso, e soprattutto che discriminano maggiormente i dati.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
|
#9 |
|
Senior Member
Iscritto dal: May 2004
Città: Londra (Torino)
Messaggi: 3692
|
PRova a scrivere il primo pezzo cosi':
SELECT 'TabellaA' as nomeTabella FROM MaterialeA WHERE Nome='quellochecerco' Ovviamente tutte le tabelle "Materiale" devono avere la colonna "Nome", altrimenti dovrai usarare il nome di colonna corretto... Comunque quoto il collega. Una specifica che detti "E ci devono essere N tabelle diverse", non e' una specifica.
__________________
Se pensi che il tuo codice sia troppo complesso da capire senza commenti, e' segno che molto probabilmente il tuo codice e' semplicemente mal scritto. E se pensi di avere bisogno di un nuovo commento, significa che ti manca almeno un test. |
|
|
|
|
|
#10 | |
|
Senior Member
Iscritto dal: Jan 2004
Città: ROMA
Messaggi: 2055
|
Quote:
PS: sì, la normalizzazione l'ho studiata ed ammetto di non averla applicata, ma questo è ben diverso da dire che è progettato male, visto che la normalizzazione è una cosa che si fa alla fine (quindi non è che in base a questo si può giudicare un'intera progettazione che è composta di più fasi). Giusto per parlare, non ho normalizzato semplicemente perché il database di questa applicazione non richiede alti livelli, e anche in base al budget di spesa che si è prefissato il cliente, posso permettermi di non averlo ottimizzato come si deve. Sul fatto della progettazione, fidati che ho seguito perfettamente le metodologie che ho imparato nei suddetti corsi. |
|
|
|
|
|
|
#11 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Io non ho giudicato (e non mi posso permettere di farlo) l'intero progetto, ma quel poco che ho visto.
Anche partendo da zero, quella che ho esposto sopra è la strada che avrei seguito comunque. Sarà che ormai sono anni che ho a che fare con database, e mi viene naturale pensare subito a soluzioni di quel tipo. Per il resto, nessuno ce l'aveva con te.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
|
#12 |
|
Senior Member
Iscritto dal: Jan 2004
Città: ROMA
Messaggi: 2055
|
Ok ok...
Dunque, stavo provando con quel tipo "nuovo" di query. Ho visto che usando quella, facendo una misurazione in millisecondi, ci mette anche di più di come facevo io, ovvero fare esplicitamente la scansione di tutte le tabelle una dopo l'altra. All fine mi sembra di capire che quella query faccia la stessa cosa. Probabilmente manca quella clausola UNION. |
|
|
|
|
|
#13 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
E' molto strano, perché con le select & union che ha suggerito gugo prima, dovrebbe essere il server a fare tutto, e nella maniera più efficiente.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
|
#14 |
|
Senior Member
Iscritto dal: Jan 2004
Città: ROMA
Messaggi: 2055
|
Ok, proverò a impostare una 30ina di query, vediamo che succede!
|
|
|
|
|
|
#15 |
|
Senior Member
Iscritto dal: Jan 2004
Città: ROMA
Messaggi: 2055
|
Ho provato con le 30 query e UNION ALL.
Avverto un leggero miglioramento di prestazioni effettivamente! GRAZIE!!! |
|
|
|
|
|
#16 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Adesso potresti provare a normalizzare le due tabelle, come avevo indicato prima: vedrai che la situazione migliorerà di molto (con una sola query senza union dovresti poter ottenere quello che ti serve).
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
|
#17 |
|
Junior Member
Iscritto dal: Apr 2006
Città: Roma
Messaggi: 12
|
Mi intrometto nella vostra discussione perchè interessa anche a me. In particolar modo vorrei approfondire il suggerimento di cdimauro.
Se ho ben capito tu suggerisci (all'atto pratico) di sostituire il campo "nome" con il campo "idmagazzino" nelle sottotabelle, e aggiungere, quindi, il campo id nella tabella magazzino. Se cosi fosse vorrei capire bene perchè modificare un tipo di campo in MATERIALEX ed aggiungerne un altro in MAGAZZINO, dovrebbe migliorare la situazione rispetto ad ora. Quello che suggerisci te non è un semplice "cambio di variabile" (concedimi il termine Grazie. |
|
|
|
|
|
#18 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Non c'è soltanto un "cambio di variabile", ma di tipo. Questo perché nella tabella MAGAZZINO l'informazione Nome è di tipo testuale, mentre IDMagazzino è un intero.
Oltre a questo, normalizzando si compatta meglio lo spazio delle tabelle MATERIALEX, perché un intero (a 32 bit) occupa mediamente molto meno spazio rispetto a un campo testuale di lunghezza variabile (diciamo che fino a 2 caratteri il VARCHAR ha un vantaggio). Questo vale anche per l'indice sul campo. In generale ciò comporta anche delle ricerche più veloci.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
|
#19 | |
|
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Quote:
|
|
|
|
|
|
|
#20 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
La struttura non è identica: ci sono tabelle che hanno campi diversi.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 16:44.





















