黃仁勛GTC喊話:全世界誤判了,推理所需算力是原以為的百倍
圖片來源:視覺中國(guó)
藍(lán)鯨新聞3月19日訊(記者 朱俊熹)在DeepSeek引發(fā)市場(chǎng)對(duì)GPU需求的擔(dān)憂后,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛總是會(huì)抓住各種亮相機(jī)會(huì)大談其AI暢想,希望提振投資者對(duì)英偉達(dá)的信心。這次的舞臺(tái)是3月17日起在美國(guó)加州舉辦的英偉達(dá)GTC大會(huì)。隨著近年來英偉達(dá)在AI浪潮中地位的不斷提升,GTC大會(huì)也從原先單純的開發(fā)者活動(dòng)成為全球矚目的科技盛會(huì)。
當(dāng)?shù)貢r(shí)間3月18日,黃仁勛在主題演講中將今年的GTC描述為“AI的超級(jí)碗”。他表示,唯一的區(qū)別是,每個(gè)人都能在這場(chǎng)超級(jí)碗中獲勝,“每個(gè)人都是贏家”。AI能夠?yàn)楦嘈袠I(yè)和公司解決問題,因此每年都有更多的人前來加入。
AI芯片路線圖的更新依然是本屆GTC的重頭戲,但英偉達(dá)的野心已不僅于此。它劍指AI時(shí)代基礎(chǔ)設(shè)施層的大一統(tǒng),布局橫跨軟、硬件,希望為更多企業(yè)提供以英偉達(dá)為核心的數(shù)據(jù)中心解決方案。
正如黃仁勛在演講中提到的,AI始于云端,云數(shù)據(jù)中心的基礎(chǔ)設(shè)施為AI的騰飛提供了環(huán)境。今年以來,英偉達(dá)已向美國(guó)四大云巨頭出貨360萬(wàn)塊Blackwell芯片。但AI不會(huì)局限在云端,它將無(wú)處不在。事實(shí)上,英偉達(dá)正在構(gòu)建三類AI基礎(chǔ)設(shè)施:面向云端的、面向企業(yè)的、面向機(jī)器人的。
圖片來源:英偉達(dá)
推理將成未來十年核心工作負(fù)載
DeepSeek爆火并一度重創(chuàng)英偉達(dá)股價(jià)后,黃仁勛多次公開回應(yīng)稱,投資者對(duì)DeepSeek取得的進(jìn)展存在誤解。它不代表AI公司不再需要任何計(jì)算,相反推理模型仍然依賴于大量的計(jì)算資源。
在GTC演講中,黃仁勛再度直言道,“在過去一年里,幾乎全世界在這個(gè)問題上都犯了錯(cuò)誤。AI的計(jì)算需求及其擴(kuò)展定律實(shí)際上更具韌性,甚至呈現(xiàn)出超加速的趨勢(shì)。由于代理型 AI(Agentic AI)和推理能力的發(fā)展,目前所需的計(jì)算量輕松達(dá)到了去年同期我們以為所需的100倍。”
對(duì)于這一論點(diǎn),他給出了更詳細(xì)的闡釋。黃仁勛表示,具備推理能力的AI會(huì)對(duì)問題進(jìn)行逐步拆解,并以各種不同方式得出最佳答案,而不是一次性地隨意給出一個(gè)結(jié)果。模型變得更加復(fù)雜,生成的token數(shù)量顯著增加了10倍。為了保證模型的響應(yīng)速度、使其具備交互性,避免用戶在等待思考的過程中失去耐心,計(jì)算速度也得提高10倍。“因此,最終所需的計(jì)算量輕松達(dá)到原來的100倍。”
另一家芯片巨頭AMD也在釋放類似的態(tài)度。3月18日,AMD董事會(huì)主席兼CEO蘇姿豐亮相在北京舉辦的AMD AI PC創(chuàng)新峰會(huì)。她在發(fā)言中表示,AMD最新發(fā)布的Ryzen AI Max處理器能夠高效運(yùn)行推理模型,以期解決更復(fù)雜的問題、實(shí)現(xiàn)更深入的理解以及更自然的交互。蘇姿豐稱,“AMD的軟件開發(fā)人員一直專注于優(yōu)化DeepSeek,每隔幾天就能看到性能的提升,這充分說明了推理技術(shù)還處于非常早期的階段。”
在黃仁勛看來,隨著人工智能的擴(kuò)展,推理將成為未來十年最重要的工作負(fù)載之一。他認(rèn)為很多人忽視了推理背后的計(jì)算問題:一方面,想讓AI生成更多的token,使其更智能;另一方面,又要平衡回答問題的時(shí)間,以防用戶因等待過長(zhǎng)而離開。黃仁勛將新時(shí)代的計(jì)算機(jī)視作AI工廠,是token的生成器。這個(gè)工廠必須以極高的效率和性能運(yùn)作,因?yàn)橐磺卸紝⒅苯佑绊慉I服務(wù)質(zhì)量、收入和盈利能力。
芯片路線圖再更新,卻帶不動(dòng)股價(jià)
黃仁勛有套經(jīng)典的計(jì)算理論,即在AI和加速計(jì)算領(lǐng)域,“買得越多,省得越多”,因?yàn)椴捎糜ミ_(dá)的技術(shù)能夠幫助企業(yè)節(jié)省成本。當(dāng)推理成為模型進(jìn)化的新范式,黃仁勛又在最新演講中添上了后半句,“現(xiàn)在甚至更好,買得越多,賺得越多”。
以此次預(yù)告將在今年下半年推出的下一代Blackwell Ultra芯片為例,英偉達(dá)明確表示該系列產(chǎn)品是為了AI推理時(shí)代鋪平道路。據(jù)其介紹,集成了Blackwell Ultra的GB300服務(wù)器在運(yùn)行DeepSeek-R1模型時(shí),每秒可以處理1000個(gè)tokens,而使用Hopper芯片的前一代服務(wù)器每秒僅能處理100個(gè)tokens。由于Blackwell Ultra單位時(shí)間內(nèi)能夠生成更多內(nèi)容,這讓AI工廠的收入機(jī)會(huì)也增加了50倍。
圖片來源:英偉達(dá)
在GTC大會(huì)上,黃仁勛還披露了更多未來幾代GPU的性能細(xì)節(jié)。其中,以暗物質(zhì)發(fā)現(xiàn)先驅(qū)、天文學(xué)家命名的Vera Rubin芯片將在2026年下半年發(fā)布。Vera Rubin由名為Vera的CPU和名為Rubin的GPU組成,而Rubin又是由兩塊GPU組成的單獨(dú)GPU。當(dāng)和Vera搭配使用時(shí),Rubin可以在運(yùn)行模型時(shí)處理每秒50千萬(wàn)億次浮點(diǎn)運(yùn)算,比當(dāng)前Blackwell芯片每秒20千萬(wàn)億次浮點(diǎn)運(yùn)算的速度要高出1.5倍。
根據(jù)英偉達(dá)路線圖,2027年下半年將繼續(xù)推出下一代Vera Rubin Ultra芯片。該芯片實(shí)際將包含兩個(gè)連接在一起的Rubin GPU,性能翻倍提升至每秒100千萬(wàn)億次浮點(diǎn)運(yùn)算。黃仁勛還首次公開了Vera Rubin之后的下一代架構(gòu)Feynman,計(jì)劃將在2028年面世,但未給出關(guān)于Feynman的更多技術(shù)細(xì)節(jié)。
圖片來源:英偉達(dá)
為了進(jìn)一步證明在后DeepSeek的推理模型時(shí)代,英偉達(dá)也將占據(jù)領(lǐng)先地位,在GTC上還釋出了一款開源的推理服務(wù)軟件Dynamo。黃仁勛表示,這個(gè)名字象征著工業(yè)革命時(shí)代的“發(fā)電機(jī)”,希望在推理成為AI主流的背景下,該軟件能用最低的成本和最高的效率加速AI推理模型,為部署此類模型的AI工廠最大程度地創(chuàng)造收入。英偉達(dá)舉例稱,在GB200上運(yùn)行DeepSeek推理模型時(shí),Dynamo可以幫助將每個(gè)GPU生成的token數(shù)量提高30倍。
然而,受累于對(duì)關(guān)稅、經(jīng)濟(jì)衰退等不利因素的擔(dān)憂,黃仁勛近兩小時(shí)的暢談還是沒能挽回投資者的信心。英偉達(dá)當(dāng)日股票收?qǐng)?bào)115.43美元/股,較前一日下跌3.43%。今年以來,該股已累跌16.54%。
這樣的市場(chǎng)反應(yīng)或許也在黃仁勛的意料之中。他在演講中介紹芯片路線圖時(shí)提到,大家的常見反應(yīng)都是,“嗯好的,接下來呢?”他強(qiáng)調(diào),對(duì)AI基礎(chǔ)設(shè)施的建設(shè)不像買一臺(tái)筆記本電腦那樣,這涉及到土地、電力、資本支出、工程團(tuán)隊(duì),需要多年的規(guī)劃和布局。因此會(huì)對(duì)外公布英偉達(dá)在未來兩三年內(nèi)的路線圖,而不是突然發(fā)布給市場(chǎng)一個(gè)驚喜。