您好,歡迎進入深圳市穎特新科技有限公司官方網(wǎng)站!
AI的發(fā)展離不開大算力、強算法、大數(shù)據(jù)三大要素。其中,大算力相當于人工智能的土壤,沒有大算力的支持,就不會有AI的成功。
美國的“如意算盤”:卡住AI芯片的“脖子”
為了限制中國人工智能等高科技產(chǎn)業(yè)的發(fā)展,早在2022年10月7日,美國政府就規(guī)定算力上限為4800(INT8 超過 600TOPS 或 FP16 超過 300TFLOPS)以及帶寬上限超過600 GB/s的AI芯片禁止向中國出口。這兩條紅線直接導致英偉達的A100、H100以及AMD的MI300系列成為管制對象。
上有政策,下有對策。作為以盈利為目的而運營的商業(yè)化公司,英偉達在遵守美國政府規(guī)定的同時,針對中國市場特意推出了A800和H800芯片。其中,英偉達A800主要替代的是A100芯片,在數(shù)據(jù)傳輸速率上為每秒400GB,低于A100的每秒600GB。在內(nèi)存帶寬上最高達2TB/s,除了性能有所下降外,其他參數(shù)變化不大;而H800的具體參數(shù)尚未公開,但是帶寬僅為H100(900 GB/s)的一半,執(zhí)行相同的AI任務(wù)時H800可能比H100多花費10%至30%的時間。
自2022年11月OpenAI推出ChatGPT以來,全球生成式AI迎來了迅速發(fā)展。而在國內(nèi)市場,隨著百度文心一言的發(fā)布,眾多大模型玩家如雨后春筍一樣涌現(xiàn),這帶動了對英偉達AI訓練/推理芯片需求的急劇增長。據(jù)供應(yīng)鏈消息,在今年7月左右,英偉達特供國內(nèi)的A800和H800芯片已經(jīng)從原來的12萬人民幣,漲至了25萬左右,甚至有的高達50萬一片。盡管價格高漲,但英偉達的AI芯片仍然一片難求,據(jù)了解英偉達A800交貨給大陸客戶的交期已經(jīng)要排到2024年第1季度。
顯然,中國AI領(lǐng)域的快速發(fā)展讓此前的禁令基本上形同虛設(shè)。意識到此前禁令規(guī)則的巨大漏洞后,時隔一年,美國針對中國AI芯片再次發(fā)起新禁令。
根據(jù)美國BIS在10月17日的新規(guī)顯示,對AI芯片的具體限制條款從之前的性能算力和帶寬限制,已經(jīng)升級到了最新的算力密度和性能限制(即在16位下:TPP>300Tflops,TPP在150~300Tflops之間且PD>1.6,TPP在100~150Tflops之間且PD>3.2三種情況下的芯片均被限制,TPP在100Tflops以下則不受限),這將直接導致英偉達A800和H800芯片停止在中國市場銷售,并且L40s、L40、RTX 4090等產(chǎn)品也會受到一定的影響。此外,AMD MI250系列、MI300系列以及英特爾人工智能芯片Gaudi2也有可能受到更新規(guī)則的影響,而且相關(guān)公司通過使用“Chiplet”技術(shù)來繞過對全芯片的限制的方式也違背了禁令規(guī)則。
美國最新出口管制對國內(nèi)終端產(chǎn)業(yè)的影響
毫無疑問,先進AI芯片的進口受阻在短期內(nèi)將會中國AI行業(yè)的發(fā)展造成一定的阻礙,并且會給相關(guān)企業(yè)的商業(yè)發(fā)展造成一定的影響。但好消息是,此次禁令主要針對的是高性能的數(shù)據(jù)中心/服務(wù)器的訓練及推理領(lǐng)域,而對智能手機、PC、游戲等消費行業(yè)的影響相對較小。
影響1:AI大模型領(lǐng)域
ChatGPT的發(fā)布讓AI迎來其“iPhone時刻”。據(jù)了解,OpenAI推出ChatGPT僅2個月,其月活用戶就已經(jīng)破億,成為史上用戶增長速度最快的消費級應(yīng)用程序。在2023年3月15日,OpenAI正式推出GPT-4,憑借多模態(tài)的文本、圖像輸入及輸出能力,直接引爆了整個科技圈。
此后,大模型市場迎來了真正的百花齊放。國外OpenAI、谷歌、微軟等大廠正打得火熱;國內(nèi)百度、阿里、華為、騰訊等科技巨頭,科大訊飛、智譜AI、商湯科技等AI公司,以及智源研究院、中科院等為代表的學術(shù)/研究機構(gòu)都紛紛投身AI大模型的浪潮中。
截止目前,從全球已經(jīng)發(fā)布的大模型分布來看,中美兩國數(shù)量合計占全球總數(shù)的80%,而美國在大模型數(shù)量方面居全球之首。有專家披露,據(jù)不完全統(tǒng)計,目前中國 10 億參數(shù)規(guī)模以上的大模型已發(fā)布 79 個。
鑒于目前生成式 AI 主要以大參數(shù)模型路徑實行,隨著模型數(shù)量和所需要處理的數(shù)據(jù)量增長,其訓練與推理均需要大量的計算能力與存儲資源,故生成式 AI 大模型應(yīng)用的蓬勃發(fā)展將帶動高算力 AI 芯片的需求增長。根據(jù)IDC的數(shù)據(jù)顯示,到2024 年,AI 訓練和推理硬件市場規(guī)模將達 930 億美元,而到 2032 年將逾 6000 億美元。
AI 訓練和推理硬件市場規(guī)模(單位:十億美元)
資料來源:IDC
大模型的發(fā)展需要先進大算力的支撐,此次美國對AI芯片出口規(guī)定的實施,將對國內(nèi)大模型未來的迭代及升級造成一定的的負面影響,會導致國內(nèi)大模型的發(fā)展落后于國外玩家。不過,需指出的是,在禁令實施前包括騰訊、百度、阿里巴巴、字節(jié)跳動等大廠已經(jīng)提前進行了AI芯片的大量囤貨,估計在一定程度上將會把影響時間推遲。
影響2:互聯(lián)網(wǎng)/云計算領(lǐng)域
近年來,隨著生成式AI的興起,字節(jié)跳動、騰訊、阿里巴巴、百度等云大廠和互聯(lián)網(wǎng)巨頭爭先搶灘AI大模型,對算力需求不斷提升。
為了保證算力的供應(yīng),互聯(lián)網(wǎng)/云大廠除了國內(nèi)服務(wù)器廠商深度綁定外,也在持續(xù)加大對AI領(lǐng)域的投資支出。據(jù)Trendforce的數(shù)據(jù),2022年全球企業(yè)AI服務(wù)器采購量中,字節(jié)跳動年采購占比達6.2%,騰訊、阿里巴巴、百度緊接其后,占比分別約為2.3%、1.5%與1.5%。各大龍頭企業(yè)抓緊布局AI業(yè)務(wù),引發(fā)AI服務(wù)器需求量激增,這直接帶動了AI芯片需求的不斷增長。
2022年全球各業(yè)者AI服務(wù)器采購量占比
資料來源:Trend Force
值得注意的是,AI服務(wù)器中價值量最高的是可用于AI訓練和推理的GPU芯片,由于此前美國政府禁令的影響,英偉達停止向中國企業(yè)出售A100和H100(5納米)兩款GPU芯片,為此百度、字節(jié)跳動、騰訊和阿里巴巴等大廠合計向英偉達A800/H800下了總額達50億美元的訂單,以提前備貨。此次A800(7納米)和H800等芯片再次被限制,這些互聯(lián)網(wǎng)廠商還需尋找更多的替代方案來保證自身業(yè)務(wù)的發(fā)展。
影響3:服務(wù)器領(lǐng)域
服務(wù)器作為高階的計算機,存儲、處理網(wǎng)絡(luò)上超過80%的數(shù)據(jù)和信息,不僅是數(shù)字經(jīng)濟的重要基建,更是AI算力的核心組成,自然迎來了難得的發(fā)展機遇。
按應(yīng)用的不同,AI服務(wù)器可分為訓練和推理兩種場景,按芯片類型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式。目前,CPU+GPU是目前國內(nèi)的主要選擇,占比91.9%。市場份額方面,浪潮信息市場占有率達20.2%,戴爾、HPE、聯(lián)想、華為占比分別為13.8%、9.8%、6.1%、4.8%。
2021年全球AI服務(wù)器市場份額
資料來源:Counterpoint,IDC
服務(wù)器行業(yè)雖然玩家眾多,但從商業(yè)模式來看,整體可以分為兩大類。一類是以戴爾、超微、惠普、浪潮、聯(lián)想等為代表的品牌服務(wù)器(浪潮的JDM模式也包含于此),另外一類是以鴻海、英業(yè)達、廣達、緯創(chuàng)、神達等為代表的白牌廠商。
從2022年美國對AI芯片出口禁令實施以來,國內(nèi)包括以浪潮信息、聯(lián)想等為代表的國內(nèi)服務(wù)器廠商業(yè)務(wù)遭受重創(chuàng)。與之形成鮮明對比的是,以鴻海、英業(yè)達、廣達等為代表的ODM廠商,是海外科技巨頭加大云資本開支的最大受益者。因為這些ODM廠商多以中國臺灣廠商為主,不受美國出口禁令的影響,并且能提供從服務(wù)器各種零部件到最終組裝的一切服務(wù),將在AI浪潮下迎來出貨量及市場份額的進一步增長。
國產(chǎn)AI芯片供應(yīng)鏈大變局
AI芯片是算力的基石。根據(jù)Gartner的數(shù)據(jù),在大模型的催化作用下,預計到2023年AI芯片市場規(guī)模將同比增長20.9%,達到534億美元。而隨著下游應(yīng)用場景的不斷落地,據(jù)其預測到2027年AI芯片市場規(guī)模預計將達到1194億美元。
1、市場需求及利益的刺激下,美國三大廠商正在積極尋求替代方案
而從主要玩家來看,由于英偉達GPU產(chǎn)品線豐富、產(chǎn)品性能頂尖、開發(fā)生態(tài)成熟,目前全球AI算力芯片市場由英偉達的GPU壟斷。根據(jù)IDC的數(shù)據(jù),2022年英偉達占據(jù)了全球95.1%的GPU算力芯片市場份額。
2022 年服務(wù)器 GPU 單元份額情況
資料來源:IDC
作為GPU的典型代表,英偉達的A100、H100自生成式AI爆發(fā)以來一直嚴重供不用求,成為了各大科技公司爭相采購的對象。而在中國市場上,互聯(lián)網(wǎng)大廠也一直以英偉達的芯片作為首選,中國買家占據(jù)了其數(shù)據(jù)中心產(chǎn)品總收入的20%至25%左右。為了合規(guī)進入中國市場,英偉達此前推出了特供中國版的A800和H800,除了互連速度不同外,仍能實現(xiàn)核心的計算能力。此次出口管制再度升級,將導致英偉達的A800和H800產(chǎn)品沒法供應(yīng),未來公司為保中國市場,可能會推出符合美國政府監(jiān)管要求低配版的L40S等產(chǎn)品,以滿足中國市場BAT等大客戶的需求。
除了英偉達之外,在AI芯片領(lǐng)域,AMD近年來也取得了不錯的發(fā)展成績。在2023年Q2,客戶對AMD AI 產(chǎn)品的“參與度”環(huán)比增長超過七倍,主要來自 MI300 的新訂單和 MI250 的增量訂購;而英特爾目前在 GPU 產(chǎn)品方面暫時掉隊,但 ASIC 產(chǎn)品方面的 Gaudi 2目前也已在出貨,而公司計劃將在 2024 年推出 Gaudi 3,希望以CPU+ ASIC的方式作為加速器的配合主攻 AI 訓練和推理。目前,AMD和英特爾的AI芯片產(chǎn)品都在本次出口管制范圍內(nèi),不過在巨大的市場需求及利益的刺激下,未來這兩家廠商預期也會推出類似此前英偉達H800 /A800的產(chǎn)品,以繞過美國政府相關(guān)規(guī)則的限制。
掃碼關(guān)注我們
傳真:0755-82591176
郵箱:vicky@yingtexin.net
地址:深圳市龍華區(qū)民治街道民治大道973萬眾潤豐創(chuàng)業(yè)園A棟2樓A08