PDA

View Full Version : [MYSQL] Campo calcolato da join di due tabelle


nanotek
04-11-2014, 22:41
Buon giorno,
il problema è abbastanza semplice, ho due tabelle
Tabella 1 "eventi":
-idEvento
-dataInizio
-dataFine

Tabella 2 "scadenze":
-idScadenza
-idEvento
-giorniScadenza

Devo unirle (JOIN) secondo il campo idEvento e aggiungere nel risultato una colonna calcolata prendendo la data "dataInizio" e sommandogli i giorni contenuti nel campo "giorniScadenza".

Ora, per unirle effetto una query join:

SELECT * FROM scadenze AS a
JOIN (
SELECT idEvento, dataInizio FROM eventi
) AS b
ON a.idEvento =b.idEvento

E fin qui ci arrivo..
ora a questo set di risultati dovrei aggiungere una colonna calcolata come prendendo la data dal campo dataInizio e aggiungendo i giorni contenuti in giorniScadenza.
Ho guardato e la funzione mysql che realizza la somma è DATE_ADD(dataInizio, INTERVAL giorniScadenza DAY)..
ma come faccio ad aggiungere una colonna e fargli capire che deve prendere i dati dai due campi delle due tabelle unite ?

Daniels118
05-11-2014, 07:44
Basta che dopo "SELECT *" aggiungi "virgola" e poi la formula per calcolare il valore del campo, eventualmente seguita da "AS nome_del_nuovo_campo".
Per prendere i valori che ti interessano devi usare nome_tabella.nome_colonna, nel caso in cui alla tabella hai assegnato un alias nome_tabella deve corrispondere all'alias; se i nomi delle colonne non sono contenuti in più tabelle è sufficiente solo il nome colonna.
In sostanza:
SELECT *, DATE_ADD(dataInizio, INTERVAL giorniScadenza DAY) AS dataScadenza
...
Se ad esempio il campo giorniScadenza si trovasse in entrambe le tabelle dovresti scrivere:
SELECT *, DATE_ADD(dataInizio, INTERVAL a.giorniScadenza DAY) AS dataScadenza
...

nanotek
05-11-2014, 08:47
funziona ;) Grazie!
l'sql mi sembra sempre un po' astruso perchè a volte fatico a seguirne il senso logico..
Io ragiono così. gli dico di selezionare tutto e poi, visto che ho i dati, posso calcolare un nuovo campo..

Invece la query risultante è:
SELECT *,DATE_ADD(dataInizio, INTERVAL giorniScadenza DAY) AS dataScadenza FROM scadenze AS a
JOIN (
SELECT idEvento, dataInizio FROM eventi
) AS b
ON a.idEvento =b.idEvento

E mi chiedo.. come fa' a selezionare tutto e calcolare quel campo se gli sto indicando solo la tabella scadenze...
forse l'interprete mysql procede al contrario ?
insomma.. la mia diccifoltà è capire la logica di come procede l'interpretazione del linguaggio per capire dove vanno messi i blocchi..

Daniels118
05-11-2014, 09:07
La select che fai dopo la join restituisce una tabella (che tu hai chiamato "b"), e tutte le tabelle in join sono disponibili per estrarre dei campi.
Comunque se posso darti un consiglio non mettere la select nella join, mettici direttamente la tabella, così:
SELECT *, DATE_ADD(dataInizio, INTERVAL giorniScadenza DAY) AS dataScadenza
FROM scadenze AS a
JOIN eventi AS b
ON a.idEvento = b.idEvento

nanotek
05-11-2014, 09:45
in realtà le tabelle sono più grandi (contengono più campi) di quello che ho descritto, quindi cerco di alleggerire il risultato selezionando solo le colonne con i dati necessari, anche perchè poi il set di risultati è abbastanza corposo qualche migliaio di righe.
Odio della join che il campo usato come riferimento nei risultati è doppio ! Sono byte sprecati..


La select che fai dopo la join restituisce una tabella (che tu hai chiamato "b"), e tutte le tabelle in join sono disponibili per estrarre dei campi.

Ecco, questa frase è abbastanza emblematica del mio problema con l'sql.. io la select la scrivo prima... ma in realtà viene dopo il join dei campi..
so che è questione d una sua logica.. ma programmando sono abituato a preparare i dati e poi selezionarli, manipolarli..

Daniels118
05-11-2014, 10:05
Non cercare di ottimizzare la query in questo modo, gli algoritmi che stanno dietro al motore sql lo fanno al posto tuo, mettendo quella query nella join impedisci agli algoritmi di "capire" come ottimizzare la query.

Non essere sorpreso dell'ordine in cui le espressioni vengono interpretate, è come con le espressioni matematiche, ci sono delle regole che stabiliscono cosa viene eseguito prima e cosa dopo, per esempio nell'espressione "1+2*3" viene eseguita prima la moltiplicazione, anche se è scritta dopo, così anche per il linguaggio sql.

Aggiungo:
l'sql non è un linguaggio di programmazione, quando fai una select non scrivi una sequenza di istruzioni, bensì definisci un criterio con il quale filtrare ed aggregare i dati.

nanotek
05-11-2014, 11:00
Ahh, adesso ho capito cosa intendi!
Nella select principale elenco solo i campi necessari, e nella join indico direttamente le due tabelle..
Sono un po' arrugginito con l'sql.. in passato ero abituato a elaborare tutti i dati nel programma.. ma ora con tabelle molto grandi non si fa'. Si sprecherebbe troppa memoria.

In realtà ho un problema.. dataInizio è un campo calcolato.. ( un IF che controlla vari valori e in base alle impostazioni sceglie la data corretta) quindi non saprei come poi richiamarlo nel set dei risultati..

Daniels118
05-11-2014, 11:12
Posta la vera query e spiega cosa vorresti ottenre, non ho la sfera di cristallo :D

nanotek
05-11-2014, 11:46
la vera query è questa..

SELECT *,DATE_ADD(dataInizio, INTERVAL giorniScadenza DAY) AS dataScadenza * qui eventalmente formatto dataInizio come gg/mm/aaaa* FROM scadenze AS a
JOIN (
SELECT idEvento, IF(primaData = 1, dataInizio, dataFine) As dataInizio FROM eventi
) AS b
ON a.idEvento =b.idEvento *qui eventualmente ordino la query secondo dataScadenza*

Daniels118
05-11-2014, 11:56
Prova in questo modo, rimuoverà anche i campi duplicati:
SELECT a.*,
IF(primaData = 1, dataInizio, dataFine) AS dataInizio,
DATE_ADD(IF(primaData = 1, dataInizio, dataFine), INTERVAL giorniScadenza DAY) AS dataScadenza
FROM scadenze AS a JOIN eventi AS b ON a.idEvento = b.idEvento

nanotek
05-11-2014, 13:06
la query viene eseguita ma a questo punto non mi serve nominare il campo dataInizio, quindi lo rimuovo.
Io lo facevo solo perchè così usavo l'alias nella funzione DATE_SUB() e date_format().. invece devo sostituire l'espressione del calcolo di dataInizio..
Così però in realà è un po' scomodo.. per espressioni più complesse dovrei sostituirle e ripeterle varie volte.. la query diventerà illeggibile..
possibile che non prenda gli alias dal set di risultati ma solo dai campi delle tabelle di origine ?

Daniels118
05-11-2014, 13:44
Si, funziona così, non c'è modo di ovviare se non quello di utilizzare una sotto query come avevi fatto all'inizio (oppure usi una vista, ma la sostanza rimane quella).
Potresti anche prendere in considerazione l'ipotesi di inserire direttamente nella tabella eventi un campo che contenga il risultato dell'espressione
IF(primaData = 1, dataInizio, dataFine)
in modo da non doverlo calcolare nella query.

nanotek
05-11-2014, 13:51
A parte il fatto che poi i teorici dei database mi darebbero del pazzo perchè creo campi con informazioni duplicate..
Dovrei poi andare a toccare tutte le altre query già fatte per inserire e modificare i dati delle altre tabelle..
oppure creare dei trigger.. per gestire quelle colonne nelle varie tabelle ma non mi piacciono molto perchè non sono molto pratico