全新 NVIDIA Pascal GPU 加速深度學(xué)習(xí)推論
NVIDIA(英偉達(dá))21日宣布推出Pascal架構(gòu)深度學(xué)習(xí)平臺(tái)的最新生力軍NVIDIA Tesla P4及P40 GPU加速器與全新軟件,在效能及速度提供大幅度的提升以加速人工智能服務(wù)的推論生產(chǎn)作業(yè)負(fù)載。
語音助理、待過濾垃圾郵件及電影與產(chǎn)品推薦引擎等現(xiàn)代人工智能(AI)服務(wù)越來越復(fù)雜,與一年前的神經(jīng)網(wǎng)絡(luò)相比需要高出10倍的運(yùn)算。目前以CPU為主的技術(shù)無法提供現(xiàn)代人工智能服務(wù)所需要的即時(shí)回應(yīng)能力,導(dǎo)致不佳的使用者經(jīng)驗(yàn)。
Tesla P4及P40特別針對(duì)推論設(shè)計(jì),使用經(jīng)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)辨識(shí)語音、影像及文字以回應(yīng)用戶和設(shè)備要求。Pascal架構(gòu)GPU具備以8位(INT8)運(yùn)算為主的專門推論指令,提供比CPU快45倍的反應(yīng)速度,與不到一年前推出的GPU解決方案相比則提升了4倍。
Tesla P4為數(shù)據(jù)中心帶來最高的能源效率,其小尺寸及最小50瓦特的低功率設(shè)計(jì)可安裝于任何服務(wù)器內(nèi),讓生產(chǎn)作業(yè)負(fù)載推論的能源效率達(dá)CPU的40倍。在進(jìn)行視訊推論作業(yè)負(fù)載時(shí),單一服務(wù)器瑞安裝單顆TeslaP4即可取代13臺(tái)僅采用CPU的服務(wù)器;而包含服務(wù)器及用電量的總持有成本則能節(jié)省達(dá)8倍。
Tesla P40為深度學(xué)習(xí)作業(yè)負(fù)載帶來最大的處理量。一臺(tái)搭載8顆Tesla P40加速器的服務(wù)器擁有每秒47兆次運(yùn)算(TOPS)的推論效能及INT8指令,可取代140臺(tái)以上的CPU服務(wù)器的效能。若以每臺(tái)CPU服務(wù)器約5,000美元計(jì)算,可節(jié)省65萬美元以上的服務(wù)器采購成本。
NVIDIA加速運(yùn)算總經(jīng)理Ian Buck表示:“有了Tesla P100以及新推出的Tesla P4及P40,NVIDIA為數(shù)據(jù)中心提供唯一的端對(duì)端深度學(xué)習(xí)平臺(tái),為各大產(chǎn)業(yè)釋放龐大的人工智能潛力。將訓(xùn)練時(shí)間從數(shù)天大幅縮短至數(shù)小時(shí),能立即解析資料,并透過人工智能服務(wù)即時(shí)對(duì)消費(fèi)者做出回應(yīng)!
實(shí)現(xiàn)更快速推論的軟件工具
另外與TeslaP4及P40推出的包含兩項(xiàng)加速人工智能推論的創(chuàng)新軟件:NVIDIATensorRT及NVIDIA DeepStream SDK。
TensorRT為針對(duì)優(yōu)化生產(chǎn)部署所設(shè)計(jì)的深度學(xué)習(xí)模型函式庫,具有立即回應(yīng)極度復(fù)雜網(wǎng)絡(luò)的能力。透過訓(xùn)練過的32位或16位定義神經(jīng)網(wǎng)絡(luò)以及設(shè)定以降低精度的INT8運(yùn)算為目的進(jìn)行優(yōu)化,將深度學(xué)習(xí)應(yīng)用的處理量及效率極大化。
NVIDIA DeepStream SDK銜接強(qiáng)大的Pascal服務(wù)器,與雙CPU只能處理7個(gè)串流的運(yùn)算能力相比,能即時(shí)同步解碼并分析高達(dá)93個(gè)HD視訊串流。這解決人工智能的其中一項(xiàng)重大挑戰(zhàn):處理大規(guī)模的影音內(nèi)容分析以應(yīng)用到如自駕車、互動(dòng)式機(jī)器人、過濾及廣告投放等領(lǐng)域。深度學(xué)習(xí)整合至視訊應(yīng)用中讓企業(yè)能提供前所未有、智能且創(chuàng)新的視訊服務(wù)。
協(xié)助客戶向前邁進(jìn)
NVIDIA的客戶提供越來越多需要最高運(yùn)算效能的創(chuàng)新人工智能服務(wù)。其中中國(guó)臺(tái)灣廠商廣達(dá)持續(xù)在服務(wù)器業(yè)務(wù)與NVIDIA合作,從世上首座人工智能超級(jí)電腦系統(tǒng)DGX-1、Facebook Big Sur推論服務(wù)器到搭載NVIDIA糖果盒大小Tesla P4輕巧1U服務(wù)器,皆透過該公司而得以打造出優(yōu)異的產(chǎn)品陣容。
NVIDIA共同創(chuàng)辦人暨CEO黃仁勛表示:“廣達(dá)從早期便與我們一同致力于GPU服務(wù)器發(fā)展,不論想建造何種類型數(shù)據(jù)中心,透過我們與廣達(dá)及云達(dá)的合作都能達(dá)成!
云達(dá)科技總經(jīng)理?xiàng)钋缛A表示:“我們的客戶相當(dāng)倚重云達(dá)在超大規(guī)模、高密度融合機(jī)架式等級(jí)解決方案中的領(lǐng)導(dǎo)地位,這些解決方案通常都需要高效能的作業(yè)負(fù)載。以深度學(xué)習(xí)的應(yīng)用而言,平行運(yùn)算回應(yīng)之間的延遲性表現(xiàn)十分重要,而TeslaP40和P4正是能表現(xiàn)出準(zhǔn)確與靈敏效能的新一代GPU解決方案!
編輯:admin 最后修改時(shí)間:2018-01-05