24萬(wàn)元一片!NVIDIA最強(qiáng)GPU全面投產(chǎn),超 50 款服務(wù)器型號(hào)面世
導(dǎo)語(yǔ):最新消息,英偉達(dá)3月份發(fā)布的計(jì)算卡H100終于開(kāi)始出貨,也是10月份開(kāi)始上市。由此看來(lái),NVIDIA在GTC 2022上宣布 NVIDIA H100 Tensor Core GPU全面投產(chǎn),也算是其對(duì)臺(tái)積電下了“超級(jí)急件”訂單傳聞的表態(tài)了。
9月22日消息,在昨晚的GTC 2022大會(huì)(上下半年各一次),NVIDIA不僅發(fā)布了RTX4080/4090系列顯卡,還宣布了一件事,那就是3月份發(fā)布的計(jì)算卡H100終于開(kāi)始出貨,也是10月份開(kāi)始上市。
換言之,英偉達(dá)NVIDIA H100 Tensor Core GPU全面投產(chǎn),NVIDIA全球技術(shù)合作伙伴計(jì)劃于10月推出首批基于開(kāi)創(chuàng)性NVIDIA Hopper架構(gòu)的產(chǎn)品和服務(wù)。
實(shí)際上,H100加速卡今年3月份的GTC大會(huì)上發(fā)布,距今剛好半年了,采用Hopper架構(gòu),GH100大核心,臺(tái)積電4nm制造工藝、CoWoS 2.5D封裝技術(shù),集成800億個(gè)晶體管,核心面積814平方毫米。
據(jù)悉,它擁有18432個(gè)CUDA核心、576個(gè)Tensor核心、60MB二級(jí)緩存,支持6144-bit位寬的六顆HBM3/HBM2e,支持PCIe 5.0,支持第四代NVLink總線。
另外,H100計(jì)算卡有SXM、PCIe 5.0兩種樣式,其中SXM版本15872個(gè)CUDA核心、528個(gè)Tensor核心,PCIe 5.0版本14952個(gè)CUDA核心、456個(gè)Tensor核心,功耗最高達(dá)700W。
編者也了解到,關(guān)鍵的是,H100使企業(yè)能夠削減AI的部署成本,相較于上一代,在提供相同AI性能的情況下,可將能效提高3.5倍,總體擁有成本減少至1/3,所使用的服務(wù)器節(jié)點(diǎn)數(shù)也減少至1/5。
可喜的是,NVIDIA DGX H100系統(tǒng)現(xiàn)在也已開(kāi)始接受客戶預(yù)定。該系統(tǒng)包含8個(gè)H100 GPU,F(xiàn)P8精度的峰值性能達(dá)到32PFlops。每個(gè)DGX系統(tǒng)都包含NVIDIA Base Command和NVIDIA AI Enterprise軟件,可實(shí)現(xiàn)從單一節(jié)點(diǎn)到NVIDIA DGX SuperPOD的集群部署,為大型語(yǔ)言模型和其他大規(guī)模工作負(fù)載的高級(jí)AI開(kāi)發(fā)工作提供支持。
對(duì)于需求方最關(guān)心的問(wèn)題,H100的價(jià)格沒(méi)有官方消息,不過(guò)之前日本市場(chǎng)有過(guò)預(yù)售,PCIe版本的都要475多萬(wàn)日元,人民幣要24萬(wàn)元以上了,SXM版價(jià)格應(yīng)該會(huì)更貴。
但也有最新消息顯示,H100加速卡10月份上市,其中亞馬遜、谷歌及微軟三大云服務(wù)供應(yīng)商會(huì)率先采用,還有就是科研機(jī)構(gòu)及高校,洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室和瑞士國(guó)家超級(jí)計(jì)算中心、日本筑波大學(xué)也會(huì)采購(gòu)。
另一方面,全球領(lǐng)先的計(jì)算機(jī)制造商所提供的搭載H100的系統(tǒng)預(yù)計(jì)將在未來(lái)幾周內(nèi)發(fā)貨,到今年年底將有超過(guò)50款服務(wù)器型號(hào)面市,2023年上半年還將有數(shù)十款型號(hào)面市。已在構(gòu)建系統(tǒng)的合作伙伴包括源訊(Atos)、思科、戴爾科技、富士通、技嘉科技、慧與、聯(lián)想和超微。
回顧數(shù)日前(9月19日),據(jù)中國(guó)臺(tái)灣省《經(jīng)濟(jì)日?qǐng)?bào)》報(bào)道,全球GPU龍頭英偉達(dá)近期對(duì)臺(tái)積電下了“超級(jí)急件(super hot runs)”訂單,以提前生產(chǎn)原計(jì)劃明年出貨的部分產(chǎn)品。傳聞稱,這批“超級(jí)急件”涉及5000片晶圓產(chǎn)能,相關(guān)產(chǎn)品的交期將大幅縮短,從原本預(yù)估的5-6個(gè)月,壓縮至2-3個(gè)月,臺(tái)積電最快將在10月底至11月初向英偉達(dá)開(kāi)始交貨。
由此看來(lái),NVIDIA在GTC 2022上宣布 NVIDIA H100 Tensor Core GPU全面投產(chǎn),也算是對(duì)上述傳聞的“表態(tài)”了。
為何如此著急?皆因在8月底,美國(guó)方面命令NVIDIA及AMD停止向中國(guó)大陸、中國(guó)香港和俄羅斯銷售部分高性能GPU,其中就包括NVIDIA的A100和H100。
對(duì)此,NVIDIA與美國(guó)相關(guān)部門(mén)展開(kāi)了積極斡旋,很快在9月1日,他們公告聲明已獲得美國(guó)政府批準(zhǔn),可以在明年3月前繼續(xù)向美國(guó)客戶出口(到中國(guó))的產(chǎn)品提供A100,可以在明年9月前繼續(xù)履行A100和H100的訂單。
總的來(lái)說(shuō),考慮到中國(guó)是NVIDIA和AMD最重要的市場(chǎng)之一,美國(guó)方面決定給予禁售令最多1年的寬限期。而為了應(yīng)對(duì)市場(chǎng)和出口管制政策的不確定因素,NVIDIA也要在這1年內(nèi)盡可能多地保障客戶長(zhǎng)期需求,所以向臺(tái)積電下“超級(jí)急件”訂單,早些生產(chǎn)出明年出貨的量,滿足市場(chǎng)客戶“囤貨”的需求。
編輯:ZQY 最后修改時(shí)間:2022-09-23