|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Bannato
Iscritto dal: Mar 2004
Città: Roma
Messaggi: 2682
|
[MySql] Aiutatemi a trovare una strategia per popolare un database con molti dati
Ciao,
sono un po' disperato: devo fare un esame di laboratorio di database, devo prendere il progetto del vecchio corso (una semplicistica versione del db di sistema d aste online, popolarlo con tantissimi dati e poi ottimizzare le tabelle con indici ed ottimizzazione mediante le view e far vedere la differenza di risposta delle query nel db ottimizzato rispetto alla versione non ottimizzata dello stesso. Per ottenere tali risultati devo popolare a dismisura il databse con tantissimi dati...a mano è impensabile inserire qualcosa come 5000 utenti, relative inserzioni e così via. Io ho pensato così: parto dalla prima tabella da cui avevo iniziato gli inserimenti (tabella che non è referenziata da altre tabelle ma che non referenzia nessuno) e vado avanti gerarchicamente con scrivendo qualche scriptino che preleva i dati man mano dalle tabelle create e mi genera nuovi record (anche se non sò esattamente come fare e vi chiedo una mano almeno ad aiutarmi ad impostare) Vi mostro la struttura delle prime 2 tabelle da popolare: Codice:
create table CITTA ( Cap tinyint not null references UTENTE(Cap), Citta varchar(35) not null, primary key (Cap, Citta) ) type=InnoDB; create table UTENTE ( User_Id varchar(20) not null primary key, Nome varchar(20) not null, Cognome varchar(20) not null, Data_Nascita date not null, Indirizzo varchar(50) not null, Cap int not null ) type=InnoDB; 1) CITTA che contiene il nome della città ed il relativo codice CAP 2) UTENTE che contiene i vari dati anagrafici di ogni utente Io nella tabella CITTA misi questa riga: Cap tinyint not null references UTENTE(Cap) relativa al codice CAP ma ora mi sorge il dubbio che sia sbagliata in quanto ogni città a un preciso CAP e casomai è il campo CAP di UTENTE che dovrebbe referenziare il campo Cap della tabella CITTA....o sbaglio? (potrei anche sbagliarmi visto che è più di un anno che non metto mano a SQL e la sintassi ce l'ho un po' arruginita) Comunque vabbè...se è sbagliato faccio un alter table e passa la paura.... Comunque la mia idea sarebbe questa: 1) Popolo la tabella CITTA con la lista delle associazioni (CITTA' ITALIANE) -(RELATIVO CAP) 2) Scrivo uno scriptino in qualcosa (anche C o Java) che mi realizza un file di testo contenente gli insert nella forma: un nome progressivo per il campo username (tipo USER1, USER2, USER3,...) un nome ed un cognome progressivi per i campi nome e cognome (NOME1, NOME2, NOME3,.... COGNOME1, COGNOME2, COGNOME3) una data di nascita casuale per il campo data una stringa casuale per l'indirizzo (tanto non mi serve che sia il nome di una via reale basta anche qualcosa tipo "fhoisdfhosihfsoidfhsdo") A questo punto per il cap si fà più difficile perchè devo mantenere il vincolo di integrità referenziale (si chiamava così? boo) e gli devo far estrarre dalla tabella CITTA il codice Cap di una qualsiasi (casualmente=) città realmente presente nella tabella CITTA), lo estreae e lo inserisce. A questo punto quando poi vado a fare gli insert non dovrebbe creare problemi di matching e dovrebbe inserirmi i dati correttamente....dite che è una strategia percorribile? Cosa mi consigliate di usare? Io pensavo a Java in quanto in Java mi pare molto semplice manipolare le stringhe anche se boo non sono molto esperto. Avevo sentito un amico (che deve fare lo stesso progetto ma credo stia in alto mare anche lui) che pensava di usare le stored procedure (che dovrò studiare per sto corso ma che ancora non conosco affatto). Vi prego di darmi una manina (le tabelle sono parecchie: tipo 12 e se non inizio subito e non trovo ora una strategia non finirò mai in tempo) Grazie Andrea |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jun 2007
Messaggi: 1232
|
se ho ben capito ti serve qualcosa per popolare quelle tabelle automaticamente?
http://sqlmanager.net/en/products/mysql/datagenerator
__________________
Cpu: Amd 64 X2 5200+ - Mobo:M2N32SLI DELUXE - Ram: Corsair xms2 800 mhz kit 4gb - SK Video: Gaiward GTS250 - Ali : Enermax Liberty 500 Wat - Mast DVD: 2 Nec AD-5170A - Case : Thermaltake Armor+ - Dissipatore: Thermaltake V1 Notebook: Sony Vaio VGN-Fe21M-Pda: Htc Diamond |Il mio sito|Flickr| Stanco del solito forum? Vieni a parlare di fotografia su Fotoni |
![]() |
![]() |
![]() |
#3 | |
Bannato
Iscritto dal: Mar 2004
Città: Roma
Messaggi: 2682
|
Quote:
Avevo gia provato ad usare spawner data generator che però è molto molto rozzo e praticamente non gestisce i vincoli di integrità referenziale...quindi una volta che avevo popolato una delle due tabelle...l'altra non matchava i dati... Comunque sai dirmi qualcosa circa quel presunto erore che ho trovato nel mio progetto (quello del vincoli di integrità referenziale capovolto) Grazie Andrea |
|
![]() |
![]() |
![]() |
#4 | |
Senior Member
Iscritto dal: May 2004
Città: Londra (Torino)
Messaggi: 3692
|
Quote:
E' l'utente ad abitare in una citta', e non il viceversa Quindi sarebbe corretto avere CAP come chiave primaria della tabella Citta', referenziata dalla tabella utente. Poi il fatto che in ITalia ogni CAP puo' essere associato a piu' citta' e' solo indice del fatto che CAP non puo' essere eletto a chiave primaria delle citta'. Da cosa si identifica una citta' italiana? Non c'e' alcuna direttiva ufficiale. A questo punto inserisci tu una chiave univoca privata (Il classico ID eventualmente autoincrementante) ed usa quella tutto dove occorre indicare una citta'. Per il popolamento, prima inserirai tutte le citta'. e poi tirerai a caso tutti gli utenti.
__________________
Se pensi che il tuo codice sia troppo complesso da capire senza commenti, e' segno che molto probabilmente il tuo codice e' semplicemente mal scritto. E se pensi di avere bisogno di un nuovo commento, significa che ti manca almeno un test. |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 09:02.