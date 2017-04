Più o meno un anno fa Google aveva annunciato Tensor Processing Unit, un chip ASIC progettato dal colosso di Mountain View con l'intento specifico di accelerare le fasi di inferenza nelle attività di machine learning. Inizialmente la società aveva dichiarato che la TPU avrebbe migliorato le performance-per-watt di circa 10 volte rispetto alle tecnologie tradizionali, basate su CPU e GPU.

La società ha rilasciato in questi giorni le prime informazioni sulle prestazioni della TPU, in uno studio che ha analizzato il comportamento del chip sin dal suo silenzioso debutto avvenuto nel 2015. Nonostante l'annuncio ufficiale sia stato dato lo scorso anno, è infatti già dal 2015 che Google utilizza TPU in alcuni dei servizi che ordinariamente offre al pubblico, come la ricerca delle immagini e la navigazione delle mappe.

Dai dati divulgati emerge come la società di Mountain View sia stata estremamente conservativa nell'indicare il livello prestazionale della sua TPU: l'incremento reale in termini di performance-per-watt è infatti compreso tra 30x e 80x rispetto alle soluzioni tradizionali e a seconda dei task effettuati. Se si parla invece di potenza computazionale grezza, Google afferma che la sua TPU è capace di un incremento prestazionale tra le 15 e le 30 volte rispetto a tradizionali CPU e GPU. Il software che funziona con la TPU è basato sul framework TensorFlow e una parte di questi guadagni prestazionali derivano proprio da ottimizzazioni software. Nello studio si indica, inoltre, che sarà possibile sfruttare ulteriori margini di ottimizzazione per incrementare ulteriormente le prestazioni.

Google ha lavorato alla realizzazione della TPU a partire dal 2011. La società di Mountain View fa infatti uso di algoritmi di machine learning in molti dei suoi progetti. Le attività di machine learning sono particolarmente intensive dal punto di vista prestazionale e gli ingegneri di Google hanno indicato, come esempio, che se le persone usassero la ricerca vocale per tre minuti ogni giorno, l'esecuzione dei processi di riconoscimento vocale senza la TPU richiederebbero alla compagnia il doppio dei datacenter attualmente operativi.