那個穿皮夾克的發(fā)布GPU“***”
2018-03-29 來自: 量子位 瀏覽次數(shù):2226
一年一度的英偉達 2018 GTC(GPU 技術(shù)大會)在美國加州舊金山南部的圣何塞如期舉行,而CEO 黃仁勛主題演講是***令人期待的環(huán)節(jié),每年的 GTC 上,被粉絲們稱為 " ***教父 " 的 GPU 領(lǐng)袖老黃都會帶來一場重磅主題演講,今年英偉達延續(xù)“核 武器工廠”的風格,搞出了個***GPU,售價也令人肝疼:250萬。除此之外,老黃還宣布暫停了自動駕駛測試,看來Uber無人車事故也影響了英偉達。
“英偉達的新殺器又來了?!痹贕TC 2018大會上,黃仁勛發(fā)布***GPU——DGX-2。
DGX-2能夠?qū)崿F(xiàn)每秒2千萬億次浮點運算(2 PFLOPS),性能比去年9月推出的DGX-1性能提高了10倍,售價39.9萬美元(人民幣250萬元)。
這次的GTC 2018大會在美國加州圣何塞舉行,黃仁勛照例身著皮衣登臺演講。(官方還特別提示:這次是一件全新的皮衣)
而老黃這次的演講主題,是四個Amazing:amazing graphics、amazing science、amazing AI、amazing robots。
首先,從不可思議的圖像開始。
不可思議的圖像
在這個環(huán)節(jié)里,黃仁勛介紹了英偉達在圖像實時光線追蹤處理方面的進展,展示了細膩的反射效果。
這項技術(shù),稱為RTX。它面向圖形領(lǐng)域,借助深度學習技術(shù),實現(xiàn)了實時光線追蹤。
然后黃仁勛發(fā)布了基于Volta架構(gòu)的工作站GPU:Quadro GV100。它支持英偉達RTX技術(shù),支持NVLink 2,32GB容量HBM2顯存。兩個GV100相連,可以提供10000多個CUDA核心,236 teraflops的TensorFlow核心。
說著說著,老黃又開始講這句:買得越多,省得越多(The more GPUs to buy, the more money save)?!皝鞧TC,學習如何節(jié)省百萬美元?!崩宵S發(fā)出誠懇的建議。
然后進入不可思議的科學環(huán)節(jié)。
不可思議的科學
我們正處在GPU計算的關(guān)鍵點,黃仁勛表示。這部分他還介紹TESLA V100等產(chǎn)品的多快好省,也談到一些GPU在計算和醫(yī)療影像方面的貢獻,比如醫(yī)療影像超級計算機CLARA。
深度學習給醫(yī)療影響的識別帶來了諸多變革,但投入到實際使用中卻很難。醫(yī)院用著十幾年前生產(chǎn)的超聲儀,黑白渣畫質(zhì)成了醫(yī)療進步的阻礙,要等所有醫(yī)院升級設(shè)備,可能要花上30年。
CLARA是一款醫(yī)療影像的超級計算機,讓醫(yī)院可以升級那些已有的系統(tǒng)。醫(yī)生可以仍然用原有的超聲、CT等設(shè)備,然后將圖像輸入超級計算機,推理出更清晰的圖像。
在這個項目上,英偉達聯(lián)合了一大群醫(yī)療行業(yè)的合作伙伴:
以及在這個環(huán)節(jié),黃仁勛又引導全場跟他念:買得越多,省得越多(brainwashing)。
來到不可思議的AI環(huán)節(jié)。
不可思議的AI
這個環(huán)節(jié)的主題是“***的GPU”。
首先,英偉達把Volta V100m每張卡的內(nèi)存擴大到32GB。適用于內(nèi)存密集型的深度學習和高性能計算,還能將內(nèi)存受限的HPC應(yīng)用性能提升高達50%。
其次,是全新發(fā)布的互聯(lián)結(jié)構(gòu)NVSwitch,帶寬比PCIe交換機高出5倍,you支持16個Tesla V100同時以2.4TB/秒的速度進行通信。
最高,一個全新的DGX服務(wù)器發(fā)布。
黃仁勛說這個現(xiàn)在是***的GPU了:新的DGX-2,包括20億個晶體管,12個交換機。每個GPU都可以通過光纖交換機互相通信,比PCIe接口快20倍。
DGX-2的算力可達2千萬億次浮點運算,功耗10千瓦。這臺機器內(nèi)部是NVLink連接的兩組Tesla V100陣列。
與6個月前發(fā)布的DGX-1相比,DGX-2提速10倍。
五年前,在兩塊GTX 580上進行Alexnet訓練耗時六天,現(xiàn)在使用DGX-2,可以在18分鐘以內(nèi)完成。
這款產(chǎn)品將于今年三季度發(fā)售,每臺價格39.9萬美元(人民幣250萬元)。
DGX-2具有300臺服務(wù)器的深度學習處理能力,占用15個數(shù)據(jù)中心機架空間,而體積則縮小60倍,能效提升18倍。
英偉達還更新了CUDA、TensorRT、NCCL、cuDNN等深度學習和HPC軟件堆棧。新版的TensorRT能快速優(yōu)化、驗證和部署在超大規(guī)模的數(shù)據(jù)中心,針對更廣泛的應(yīng)用加速深度學習推理。它you可以將深度學習推理的速度加快190倍,降低70%的數(shù)據(jù)中心成本,還集成到了谷歌TensorFlow 1.7版本中,更易于使用。
另外,NVIDIA還宣布和ARM合作,將英偉達深度學習加速器架構(gòu)集成到Arm的Project Trillium上,在手機、智能家居等設(shè)備上實現(xiàn)深度學習推理。以及英偉達GPU現(xiàn)在支持Kubernetes了。這是一個基于容器技術(shù)的分布式架構(gòu)方案。這個技術(shù)讓英偉達的GPU進一步加速。
還有一事,英偉達驕傲的宣布,TITAN V仍然斷貨中。
最高是不可思議的機器人環(huán)節(jié)。
不可思議的機器人
發(fā)布了機器人開發(fā)工具包Issac SDK之后,話題轉(zhuǎn)向了自動駕駛。
“我們正試圖從頭到尾了解這個系統(tǒng),這其中包含四個***重要的方面:數(shù)據(jù)收集、模型訓練、模擬和駕駛?!崩宵S說,這個了解過程,大約花了5到7年。
老黃在現(xiàn)場,又展示了一把云代駕。
他把VR和自動駕駛結(jié)合起來。通過一個VR眼鏡和方向盤,就能啟動自動駕駛汽車。
云代駕所用的平臺,是新鮮發(fā)布的NVIDIA DRIVETM Constellation,基于兩臺服務(wù)器。
臺服務(wù)器運行NVIDIA DRIVE Sim 軟件,用以模擬自動駕駛汽車的傳感器,如攝像頭、激光雷達和雷達。第二臺服務(wù)器搭載NVIDIA DRIVE PegasusTM AI汽車計算平臺,可運行完整的自動駕駛汽車軟件堆棧,并能夠處理模擬數(shù)據(jù),這些模擬數(shù)據(jù)如同來自路面行駛汽車上的傳感器。
每輛汽車都在收集PB級的數(shù)據(jù),每個月有1500人大概標注100萬件物品。老黃表示,英偉達并沒有試圖建立一個基于軟件定義的計算機的自主車輛系統(tǒng),確切的說是在研究一個架構(gòu)。
英偉達以Drive PX Parker單芯片架構(gòu)為基礎(chǔ)創(chuàng)建DRIVE Xavier。這是一個四芯片系統(tǒng),包含兩個Xaviers和兩個Voltas。這臺耗能300瓦的電腦正在用于機器人汽車,將于今年晚些時候投入生產(chǎn)。這項技術(shù)英偉達擁有全部產(chǎn)權(quán)。
BTW,英偉達最后還宣布暫停了自動駕駛測試。
可能是受此影響,發(fā)布會一開始,英偉達股價就同步下跌,至發(fā)布會結(jié)束,英偉達股價累積下跌6.64%。無人駕駛事故的影響還得持續(xù)一段時間。
產(chǎn)品分類
產(chǎn)品分類