摘要:大模型掀起巨浪,創業者如何找到方向?
作者 | 唐飛
編輯 | 宋函
近幾個月,AI大模型扎堆出現,有人將之稱作“百模大戰”。
的確,從百度、阿里到科大訊飛、商湯等推出的大模型,到王慧文的光年之外、李志飛的序列猴子等,大模型產品的陸續內測幾乎占據了媒體的重要版面。
而在大模型的應用層,已有包括在線辦公、金融科技、在線教育等多個細分垂直領域公布了大模型領域進展。
百度創始人、董事長兼首席執行官李彥宏指出,“我非常看好中國AI應用的發展前景,如果回顧過去幾十年歷史,在中國大家都非常愿意擁抱新興技術。雖然我們沒有發明Android、iOS或Windows系統,但我們開發了許多非常創新的應用,比如微信、抖音和滴滴等,還有很多應用都很受歡迎、很實用。在人工智能時代,也是同樣的情況。科技帶來了很多可能,我們非常善于開發應用,并充分利用了這些可能。”
面對如此熱潮,很多創業團隊也希望躋身其中,但由于技術實力、資金儲備和算力的限制,他們很難快速將想法落地,甚至有悲觀者將AI大模型創業稱為“諸神之戰”,認為它與“凡人”無關。
“千載難逢”的機會
創新工場董事長兼CEO李開復表示:“AI大模型是中國不容錯過的歷史機遇。通過發展AI大模型,中國可以推動創新產業的發展,實現科技與經濟的雙重紅利。”
啟明創投合伙人周志峰也認為,中國與美國對于AI通用底座大模型的生態環境非常不同,中國有很多獨特的機會。除了高技術壁壘、高人才密度和高資本需求的大模型方向,年輕創業者、垂直產業老兵、AI界大咖在技術和應用多個維度都有不同的創業機會。
圖源:《AIGC發展研究報告1.0版》,清華大學
的確,過去幾個月里國內互聯網企業、科技巨頭和高校院所展開了一輪關于大模型的“軍備競賽”。3月,在OpenAI發布GPT-4大模型后,百度正式發布“文心一言”。
隨后的整個4月可以被稱為“大模型的發布月”,華為“盤古”、360“智腦”、商湯“日日新SenseNova”、知乎“知海圖AI”、昆侖萬維“天工”等等密集發布。
部分沒有趕上這波熱潮的企業則先把上線日期公布了出來,提前“卡位”,字節跳動自研的大模型計劃今年9月上線,京東“言犀”最晚也在年內推出。
大廠之外,眾多“大佬”也密集入局。3月,前阿里技術副總裁賈揚清宣布離職阿里,未來創業方向為AI大模型底層技術相關,目前第一輪融資已經到位。4月,出門問問創始人李志飛宣布推出AI大語言模型“序列猴子”。更早前,原美團聯合創始人王慧文一條朋友圈傳播甚廣,“5000萬美元,帶資入組,不在意崗位、薪資和title,求組隊。”表明了他的決心。
一位業內人士形容大模型熱潮是“這幾乎趕上了2000年左右的互聯網創業潮,沒有人想錯過這班車”。
除了這些眾所周知的企業和大佬,還有更多創業者在趕來的路上。
“據不完全統計,中國10億以上參數規模的大模型已經發布了79個,從地區來看北京和廣東最多,自然語言處理是大模型研發最活躍的領域。”在中關村論壇上,中國科學技術信息研究所所長、科技部新一代人工智能發展研究中心主任趙志耕披露了中國人工智能大模型的情況。
一位投資人告訴我們,現階段投資機構一般把AIGC投資分為應用層、模型層、基礎層三個層面。
基礎層包括算力、存儲、數據,每個領域都有傳統企業把守,新玩家基本進不去。所以大模型創業的機會,屬于大廠和明星公司。而應用層的創業屬于腦洞大、有想法的創業者,也屬于那些在垂直領域有獨到見解的觀察者,這也是很多人選擇加入創業潮的原因。
場子熱起來后,眾多投資機構也加入其中。數據顯示,2020年GPT-3發布的兩年內,全球創投機構對AI企業的投資增長了4倍,僅2022年就有13.7億美元的融資。
火石創造產業數據中心數據顯示,3月,國內人工智能領域(不算擬收購、被收購、定增、掛牌上市)共發生融資72起,累計披露融資金額74.55億元。4月國內人工智能領域共發生了66起融資事件,累計披露的融資金額35.24億元。
“百模大戰”,創業者如何“突圍”
一位AI行業投資人告訴我們,對于參與到AI大模型競爭中的企業來說,無論是大廠還是創業團隊,競爭幾乎是全方位的,技術、資金、產品、運營、市場、人員配置等,缺一不可。
對于創業團隊來說,起步初期最大的問題就是缺乏資金和技術支持,這讓很多創業團隊躊躇不前。
因為大模型的技術特點決定了高昂的研發門檻和持續的資金消耗。以ChatGPT為例,2018年OpenAI在訓練GPT-1時,所用到的參數數量和數據訓練量分別為1.17億和5GB。但在2020年訓練GPT-3時,以上兩項數字則分別增長到1750億和45TB(1TB=1024GB),GPT-4的訓練參數量更是高達1.6萬億。
另據OpenAl發布的相關數據顯示,訓練13億參數的GPT-3XL模型一次消耗的算力約為27.5PF-days,訓練1750億參數的完整GPT-3模型則會消耗算力3640PF-days(即每秒一千萬億次計算,要運行3640個整日)。
以GPT-3模型消耗的算力3640PF-days為例,若按照單個500P中心項目的總投資為30.2億元來計算,若想要保證ChatGPT的正常運行,則至少需要投入7-8個數據中心,所產生的總成本超過200億元。
顯然,這是大部分初創團隊不敢輕易嘗試的生意。
為加速實現大模型在產業端的應用落地,進一步賦能、加速創業團隊的成長,百度日前正式發出“全球AI創新英雄”召集令,舉辦大模型領域首個創業大賽——百度“文心杯”創業大賽,給參賽者提供百度全棧式技術支持,同時設立10億元規模的文心投資基金,為創企提供資金+技術+業務資源的全面扶持,成為創企最強有力的“加速器”。
資金層面,最終一、二、三等獎的獲獎團隊,將分別有機會獲得總值人民幣1000萬元、500萬元、200萬元的早期投資;技術層面,將為參賽團隊提供可穩定調用的文心大模型API及百度智能云算力資源;人才方面,百度將為最終獲獎團隊,提供為期一年的AI大模型技術輔導與交流機會。
5月31日起,專注于AI方向,有意愿且有能力基于百度文心大模型搭建自己的應用,或將文心大模型與自有產品進行結合的初創團隊,或是已有成型產品或demo的初創公司,均可報名參與“文心杯”創業大賽。
目前國外已經出現了DoNotPay、Jasper、Speak等AI原生應用,而國內尚未有類似的現象級產品問世。
李彥宏認為,未來,中國會有自己的生態系統,擁有自己的大語言模型和基礎模型。中國會出現至少一個、也可能是兩個或三個基礎大模型,可以支持人們開發各種AI原生應用。美國開發者正基于ChatGPT或其他語言模型開發新應用。在中國,更多開發者將會基于文心大模型來開發AI應用。
扶上馬,送一程
從全球已經發布的大模型分布來看,中國和美國超過全球總數的80%,美國在大模型數量上居全球之首,中國從2020年進入大模型快速發展期,目前與美國保持同步增長態勢。
盡管整個賽道呈現出一片欣欣向榮,但多家券商在研報中表示,國內大模型應用層產品進度不及預期、應用層商業模式推廣不及預期等問題,以及人工智能相關政策風險。
百度創始人、董事長兼首席執行官李彥宏
李彥宏將當前的大模型生態分為三類,第一類是新型云計算公司,云計算主流商業模式將會從IaaS變為MaaS(模型即服務)。第二類是進行行業模型精調的公司,介于通用大模型和企業中間,這類企業可以基于對行業的洞察,調用通用大模型能力,為行業客戶提供解決方案。第三類是應用層的企業,基于通用大語言模型開發應用服務,這可能才是真正的機會。這其中,他最看好應用層的市場機遇。
參考海外經驗來看,事實也確實如李彥宏預測。典型的案例如Jasper,其以“AI文字生成”為主打產品,通過其文字生成功能,用戶可以輕松生成Instagram標題,編寫TikTok視頻腳本、廣告營銷文本、電子郵件內容等略顯燒腦的重復性工作。
作為行業翹楚,Jasper去年擁有超過70000名客戶,并創造了4000萬美元的收入,預計到2022年底,收入將達到9000萬美元,是去年收入的兩倍以上。因此,這個成立于2021年1月,剛剛2歲的新公司一躍到了獨角獸級別。
百度也希望與全球大模型創業團隊共同成長,孵化出估值超10億美金的獨角獸企業。
“文心杯”創業大賽的正式開啟,讓更多創業者有機會獲得來自百度的全面扶持。通過比賽,百度不僅用資金和技術把創業者“扶上馬”,還將用創投的形式“送一程”。
大模型時代,不是單打獨斗、跑馬圈地的時代,百度希望做一個使能者,以全棧技術加持千行百業,構建一個繁榮強大、充滿活力的AI生態,實現協作共贏。
為什么百度有這樣的底氣,因為它是全球為數不多在芯片、框架、模型、應用四層架構中有全棧式自研技術的企業。
從“昆侖芯片、飛槳深度學習平臺、文心大模型到應用層”可以做到四層端到端的優化,形成高效的反饋閉環,最大程度地發揮各層的效能。這種全棧技術能力,讓百度有能力、有實力做到“一站式”服務。
此外,百度內部也高度重視技術創新。李彥宏在近期的內部講話中強調,“最近我看到一個數據,說全球算力規模,美國占34%,中國占33%,算力差不多。我要說,算力不能保證我們能夠在通用人工智能技術上領先,算力是可以買來的,創新的能力是買不來的,是需要自建的。”
在科技創新的大趨勢下,只有能落地到業務場景的技術才是好技術。大模型落地拼的也不是營銷和參數,是創新能力,而這種創新,絕對不是靠幾家科技大廠能夠完成的。只有依靠更多的社會化力量,促進大規模的AI應用創新涌現,讓這些創新者、創業者走的更穩、更好,才能更有效的實現中國式AI生態布局,加速高水平科技趕超引領的步伐。
總結
“大模型改變了人工智能,也即將改變世界”,李彥宏如是說。
在大模型黃金時代里,各行各業都將被改變,所有的產品、服務都將被重構,這個過程中將爆發巨大的產業機會,對于任何創業團隊而言這都是千載難逢的機會。
但這些剛剛起步的初創團隊,不可避免地將會遇到資金、研發、技術、人才等多方位的挑戰,在沒有外部的幫助之下想要獨立成長壯大,簡直難于登天。
“文心杯”為參賽的創業者提供了一輛“快車”。
百度為參賽團隊開放出文心大模型相關能力及百度智能云算力資源,并邀請來自IDG資本、百度風投、百度資本等知名機構投資人與多位百度AI專家擔任評審,既能提供資金支持又能給出專業的技術指導,讓創業團隊起跑就“快人一步”。
參考資料:
[1]《2023年AIGC發展研究報告1.0版》,清華大學
[2]《德勤全球人工智能研究院-AIGC生成式人工智能對企業的影響和意義》,德勤
[3]《GPT已拉開AIGC技術革命序幕-海外為鑒,看國內大模型與終端應用投資機會》,國信證券
[4]《專訪李開復:大模型,誰能笑到最后?》,中新網
[5]《啟明創投周志峰:大模型中國創業機會很多丨GTIC 2023》,智東西