[SQL] Query con GROUP BY + ORDER BY :D [Archivio]

View Full Version : [SQL] Query con GROUP BY + ORDER BY :D

Rubberick

16-02-2008, 11:25

Ciao ragazzi, ho un piccolo problemino con una query, vediamo se potete aiutarmi...

ho 2 tabelle organizzate cosi'

id | nome | desc

id | last_up_time | valore1 | valore2

vorrei fare una query dove ottengo id, nome, desc...

fino e qui avrei un banale

SELECT * FROM table1

tuttavia vorrei ottenere in una sola query anche i valori di table2 ordinati per tempo

SELECT * FROM table1 LEFT JOIN table2 ON (table1.id = table2.id) ORDER BY table2.last_up_time DESC

molto bene ci siamo quasi... unico problema... vorrei non avere ripetizioni...

cioe' in table 2 ci saranno molti valori con lo stesso id, in quanto la chiave primaria e' il tempo di aggiornamento che e' sempre diverso...

a me interessa ottenere un unica riga di table2 dove il tempo sia il + aggiornato =) non mi interessano tutte le altre righe con tempo vecchio

ho provato ad usare group by table1.id ma non funziona =|, cioe' mi vengono restituiti tutti i dati come li vorrei solo che l'ordinamento e' fatto in seguito... non prima di gruppare =|, le righe hanno il campo time che vogliono loro non l'ultimo aggiornamento =(

SELECT * FROM table1 LEFT JOIN table2 ON (table1.id = table2.id) GROUP BY table1.id ORDER BY table2.last_up_time DESC

Io avrei bisogno di invertire concettualmente l'ordinamento e poi il group ma mysql mi da errore... come posso fare? dove sbaglio?

gugoXX

16-02-2008, 11:53

In SQL standard si puo' fare, ma solo con una autojoin
Il problema e' anche solo limitabile alla tabella2, ovvero:
Vorrei ottenere un risultato tipo:
id | last_up_time | valore1 | valore2
ma con solo i valori piu' aggiornati, per ciascun id.

Quanto segue suppone che la chiave primaria della tabella2 sia esattamente (id, last_up_time )

Per poterlo fare in SQL-92 standard occorrono 2 passi:
per ciascun ID cerco qual e' il last_up_time maggiore, scrivendo la subquery relativa
Metto in join la subquery ottenuta con la tabella orignale, filtrando i record interessati.
Si chiama autojoin perche' la tabella in questione e' referenziata due volte.

Per questo esempio la subquery sarebbe
SELECT id,max(last_up_time) max_last_up_time
FROM tabella 2
GROUP BY id

mentre la query completa sarebbe

SELECT tabella2.*
FROM tabella2
JOIN (SELECT id,max(last_up_time) max_last_up_time
FROM tabella 2
GROUP BY id) AS subq
ON (tabella2.ID=subq.ID AND tabella2.last_up_time=subq.max_last_up_time)

Se poi hai bisogno di altre informazioni della tabella1, a questo punto potrai fare un JOIN secco, senza porti piu' problemi di distinct o altro, in quanto per costruzione la SELECT precedente avra' una e una sola riga per ciascun ID, con proprio i dati che stai cercando (ovvero quelli della data piu' recente).

Per risolvere tale limite dell'SQL, per un problema tutt'altro che raro, le singole implementazioni hanno dotato il loro motore di soluzioni diverse.

Oracle: Funzioni analitiche, inserite dal 8.1.6.2
SQL-Server 2000: Mix di TOP e ORDER BY. Non risolve completamente l'auto-Join
SQL-Server 2005: Funzioni analitiche (limitate).
My-Sql: So che esiste anche qui il TOP (mi sembra si chiami LIMIT). Non so se si puo' usare all'interno di subquery e insieme a ORDER BY. Se si potesse sarebbe la stessa soluzione di SQLServer 2000

In sostanza: Prova con la soluzione standard. Se poi non ti piace studia la LIMIT con ORDER BY.

C'e' ancora una soluzione possibile, relativamente ad una estensione del SQL standard che si chiama "INLINE Query", che pero' e' praticabile solamente se il numero di colonne come le tue valore1, valore2,... valoren e' esattamente uguale ad 1, altrimenti fa pena.
Nel tuo caso e' gia' 2, pertanto non va bene.
Non so neppure se funziona sotto mysql

SELECT ttt.id,
max( ttt.last_up_time ) max_last_up_time,
(SELECT valore1
FROM tabella2 tint
WHERE tint.id=ttt.id AND tint.last_up_time=max_last_up_time) valore1
FROM tabella2 ttt
GROUP BY id

In pratica le INLINE Query sono funzioni scalari, che devono quindi restitirue una sola riga e una sola colonna, e che possono essere calcolate in funzione di parametri della query esterna.
Ma anche in questo caso come vedi si referenzia 2 volte la tabella originale.

Rubberick

17-02-2008, 11:22

Grazie sei stato chiarissimo =) ci sono riuscito con la prima soluzione :D

francescosalvaggio

17-02-2008, 11:36

altrimenti non puoi usare il costrutto DISTINCT per evitare le ripetizioni

gugoXX

17-02-2008, 11:39

Non direi, la tabella2 ha righe tutte diverse, non ci sono ripetizioni.
Puoi provare a spiegarti meglio?

francescosalvaggio

17-02-2008, 13:13

SELECT DISTINCT attributo
FROM tabella/e

la distinct si fa sull'attributo della select che ti frega se hai più tabelle... non avevi detto che non volevi eliminare i risultati doppi ?

gugoXX

17-02-2008, 13:16

Mi sa che non hai letto bene il problema.
Lui ha una tabella
id | last_up_time | valore1 | valore2

Dove ID e' ripetuto tante volte, per degli istanti diversi.

Vuole avere una query che restituisca, per ciascun ID, quale e' il record con la data piu' grande, e quali sono i due relativi campi valore1 e valore2