PDA

View Full Version : Data Science - Dove comincio?


BBr1an
12-07-2017, 14:29
Salve a tutti! Ho 22 anni, studio economia e finanza all'uni. Da tempo mi sto appassionando all'idea di diventare un data scientist, finita la triennale forse è il percorso che sceglierò (quello o quantitative finance).

Detto questo, so che per diventare un data scientist bisogna avere, ahimè, profonde conoscenze matematiche ed essere a proprio agio con tutti gli strumenti statistici. Come se non bastasse bisogna essere degli abili programmatori visto che in fondo si tratta di statistica computazionale e la programmazione è essenziale.

Long story short, ho già provato ad utilizzare python e R, i linguaggi che dovrebbero coprire gran parte del lavoro del data scientist, inoltre ho provato c++ che dal canto suo dovrebbe essere presente negli indirizzi quotati verso la finanza (i famosi QUANTS, anche se questo è già un mestiere diverso).


Comunque sia le mie competenze informatiche si estendono fino a cercare su google "Salvatore Aranzulla" o a staccare e riattaccare la spina del router quando va via internet, va da sé che programmare in c++ è il naturale passo successivo :D

Scherzi a parte, so che su internet c'è materiale infinito per imparare, io ho provato a scrivere codici con tutti e tre i linguaggi, e l'unico con cui mi trovo a mio agio (fortunatamente) è R che uso insieme al programma RStudio (e ve lo consiglio per chiunque fosse interessato, è molto intuitivo).

Qualcosa con successo sono anche riuscito a scrivere, ma mi piacerebbe imparare in modo intelligente, cioè mi piacerebbe scrivere codici senza andare a rivedere ogni 3 nanosecondi guide e tutorial, senza mai sapere cosa posso chiedere al computer o cosa sta "facendo".

La domanda è: è meglio continuare a concentrarmi a imparare R per bene o è meglio imparare teoria e concetti fondamentali della programmazione? O magari per uno statistico è possibile bypassare qualcosa visto che dovrà fare solo inferenza e machine learning?

ITAQuasarLex
15-07-2017, 15:28
Salve a tutti! Ho 22 anni, studio economia e finanza all'uni. Da tempo mi sto appassionando all'idea di diventare un data scientist, finita la triennale forse è il percorso che sceglierò (quello o quantitative finance).

Detto questo, so che per diventare un data scientist bisogna avere, ahimè, profonde conoscenze matematiche ed essere a proprio agio con tutti gli strumenti statistici. Come se non bastasse bisogna essere degli abili programmatori visto che in fondo si tratta di statistica computazionale e la programmazione è essenziale.

Long story short, ho già provato ad utilizzare python e R, i linguaggi che dovrebbero coprire gran parte del lavoro del data scientist, inoltre ho provato c++ che dal canto suo dovrebbe essere presente negli indirizzi quotati verso la finanza (i famosi QUANTS, anche se questo è già un mestiere diverso).


Comunque sia le mie competenze informatiche si estendono fino a cercare su google "Salvatore Aranzulla" o a staccare e riattaccare la spina del router quando va via internet, va da sé che programmare in c++ è il naturale passo successivo :D

Scherzi a parte, so che su internet c'è materiale infinito per imparare, io ho provato a scrivere codici con tutti e tre i linguaggi, e l'unico con cui mi trovo a mio agio (fortunatamente) è R che uso insieme al programma RStudio (e ve lo consiglio per chiunque fosse interessato, è molto intuitivo).

Qualcosa con successo sono anche riuscito a scrivere, ma mi piacerebbe imparare in modo intelligente, cioè mi piacerebbe scrivere codici senza andare a rivedere ogni 3 nanosecondi guide e tutorial, senza mai sapere cosa posso chiedere al computer o cosa sta "facendo".

La domanda è: è meglio continuare a concentrarmi a imparare R per bene o è meglio imparare teoria e concetti fondamentali della programmazione? O magari per uno statistico è possibile bypassare qualcosa visto che dovrà fare solo inferenza e machine learning?

Ciao, io sono ingegnere informatico e ho studiato da qui: https://www.amazon.it/Data-Mining-Practical-Learning-Techniques/dp/0128042915/ref=as_li_ss_tl?_encoding=UTF8&qid=1500128638&sr=8-4&linkCode=ll1&tag=xav9th3r0ea-21&linkId=cefe9a520cd8ee749bcb4ccf14d7d8c7

( O meglio in realtà la vecchia edizione, questa è uscita da poco ). Il libro si divide in due parti principalmente: nella prima vengono spiegati nel dettaglio gli algoritmi che si nascondono dietro il machine learning. Non c' è nessun riferimento alla programmazione dal momento che viene spiegato il concetto e non l' implementazione. Nella seconda parte si discute sulla libreria Weka per il machine learning e a te sicuramente non interessa.

Se invece a te interessa, come penso, un libro che spieghi come UTILIZZARE le tecniche di data mining allora mi farebbe piacere mi consigliassi un libro qualora lo trovassi

ingframin
18-07-2017, 10:43
Comincia da questo libro: http://shop.oreilly.com/product/0636920033400.do