|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Dec 2002
Città: Milano
Messaggi: 2434
|
Da *.sql a *.csv
Salve a tutti, ho un enorme database in *.sql e vorrei arrivare al *.csv.
Il database contiene moltissimi dati di più di 80000 progetti di kckstarter. Vorrei usarlo per delle analisi statistiche, ma non ho idea di come aprire il file. In realtà io non so neanche quali siano i campi dei dati. Qualche anima pia, magari interessata all'argomento, vuole darmi una mano? Grazie. https://onedrive.live.com/redir?resi...hint=file%2cgz
__________________
Ryzen 58000x3d, Kraken x62, Aorus b550 elite v2, Sapphire rx6900xt, Kingston FURY Renegade 2x16G 3600 c16, Kingston FURY Renegade PCIe 4.0 NVMe , Seasonic 620w, NZXT h500, Quest 2, Xiaomi 34 gaming monitor 1440p 144hz. Ultima modifica di Dinofly : 01-08-2015 alle 05:13. |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Il database è vecchio di due anni (2013), ed è stato realizzato per MySQL, per cui lo devi importare prima di poterlo utilizzare.
Ormai sono un po' di anni che non ci lavoro più, ma dovresti digitare qualche comando come: mysql <kickscrape.sql che crea il db, le tabelle, e importa i dati. Una volta importato puoi esportare i dati in CSV. La tabella dei progetti è crawler_project, mentre quella dei "backer" (non so cosa significa, ma sono persone che avranno un certo ruolo su Kickstarter) è crawler_backer, mentre un'altra tabella che lega backer e progetto è crawler_backer_project.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Dec 2002
Città: Milano
Messaggi: 2434
|
Grazie, vedrò cosa riesco a fare.
I backer sono le persone che hanno donato per un progetto. Ma quali sono le "colonne"?
__________________
Ryzen 58000x3d, Kraken x62, Aorus b550 elite v2, Sapphire rx6900xt, Kingston FURY Renegade 2x16G 3600 c16, Kingston FURY Renegade PCIe 4.0 NVMe , Seasonic 620w, NZXT h500, Quest 2, Xiaomi 34 gaming monitor 1440p 144hz. Ultima modifica di Dinofly : 01-08-2015 alle 16:19. |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Le colonne sono i campi definiti all'interno della tabella.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Dec 2002
Città: Milano
Messaggi: 2434
|
Cdimauro, ma è un operazione che impiega parecchio tempo?
Perchè ho provato a guardare ma non ci capisco proprio nulla...
__________________
Ryzen 58000x3d, Kraken x62, Aorus b550 elite v2, Sapphire rx6900xt, Kingston FURY Renegade 2x16G 3600 c16, Kingston FURY Renegade PCIe 4.0 NVMe , Seasonic 620w, NZXT h500, Quest 2, Xiaomi 34 gaming monitor 1440p 144hz. |
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Jan 2005
Messaggi: 395
|
Ciao
Potresti anche creare una sorgente odbc ed accedere al database senza fare alcun export dei dati, se, per esempio, lo strumento che vuoi usare per l'analisi dei dati è excel. Non ho scaricato il file che hai reso disponibile, bisognerebbe sapere se hai realmente bisogno di tutto il database o se ti è sufficiente una piccola porzione di dati per la tua analisi. Magari potresti cavartela con qualche semplice query o hai già escluso questa ipotesi (magari per mancanza di conoscenza dell'sql..) ? Ciao |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Dec 2002
Città: Milano
Messaggi: 2434
|
Ciao, no mi servirebbe tutto il database o magari posso escludere i progetti che richiedevano meno di 5000.
Ma poi dovrei richiamare comunque la tabella di backers. Per il primo immagino il comando sia select * from crawler_project where goal >5000
__________________
Ryzen 58000x3d, Kraken x62, Aorus b550 elite v2, Sapphire rx6900xt, Kingston FURY Renegade 2x16G 3600 c16, Kingston FURY Renegade PCIe 4.0 NVMe , Seasonic 620w, NZXT h500, Quest 2, Xiaomi 34 gaming monitor 1440p 144hz. |
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
L'operazione lunga è l'importazione del db, perché ci sono parecchi dati (comunque vecchi: fino al 2013). Non ricordo bene la struttura di questa tabella (non ho sottomano il mio PC adesso), ma la query dovrebbe essere quella.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
![]() |
![]() |
![]() |
#9 |
Senior Member
Iscritto dal: Dec 2002
Città: Milano
Messaggi: 2434
|
Buongiorno a tutti, riuppo il topic perchè avrei bisogno di una trasformazione di tali dati.
Mesi fa sono riuscito ad estrarli in csv, ora ho tre tabelle di cui una con i progetti una con i finanziatori e un'altra con i singoli finanziamenti. Ciò che mi interesserebbe fare ora è creare un csv con le relazioni diatiche da infilare in stata: In pratica partendo dalla tabella con i finanziamenti per ogni finanziamento dovrei creare una tabella con la lista di tutte le alternative (i progetti attivi nel medesimo periodo e nella medesima categoria). In pratica mi serve un generatore di query che a partire dalla tabella dei singoli finanziamenti crei automaticamente delle query simili a questa (i singoli finanziamenti sono migliaia): select * from progetti where categoria=x and data<y E mi faccia una tabella mettendo tutto assieme. Sarei anche disposto a pagare uno che mi dia il csv finale.
__________________
Ryzen 58000x3d, Kraken x62, Aorus b550 elite v2, Sapphire rx6900xt, Kingston FURY Renegade 2x16G 3600 c16, Kingston FURY Renegade PCIe 4.0 NVMe , Seasonic 620w, NZXT h500, Quest 2, Xiaomi 34 gaming monitor 1440p 144hz. |
![]() |
![]() |
![]() |
#10 |
Senior Member
Iscritto dal: Sep 2008
Messaggi: 3583
|
Secondo me la via più semplice è riconvertirli in un database e da lì fare le query che ti servono. Può bastare anche Access..
|
![]() |
![]() |
![]() |
#11 |
Senior Member
Iscritto dal: Dec 2002
Città: Milano
Messaggi: 2434
|
Ok ma se parliamo di migliaia di query, come faccio a fare si che le generi autonomamente?
__________________
Ryzen 58000x3d, Kraken x62, Aorus b550 elite v2, Sapphire rx6900xt, Kingston FURY Renegade 2x16G 3600 c16, Kingston FURY Renegade PCIe 4.0 NVMe , Seasonic 620w, NZXT h500, Quest 2, Xiaomi 34 gaming monitor 1440p 144hz. |
![]() |
![]() |
![]() |
#12 |
Senior Member
Iscritto dal: Sep 2008
Messaggi: 3583
|
Penso che si riesca a fare con una query unica.. Riesci a postare la struttura delle tabelle e qualche riga d'esempio?
Inviato dal mio Nexus 5 |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 23:10.