不要無條件進入大模型。
作者|劉楊楠
編輯|栗子
在高喊“要做中國版OpenAI”之后的第136天,王慧文把光年之外賣給了美團。
2023年6月29日,美團在港交所發布公告,于2023年6月29日全資收購「光年之外」100%的股權,收購總代價包括:2.33673億美元現金+承擔3.66924億元人民幣債務+1元人民幣,合計大約20.65億元人民幣。
很難想象,國內第一家由大佬入局創辦的大模型初創公司會以這種方式收尾,這一結局給市場留下了無數的疑問和猜測。
從整體商業視角看,光年之外被美團收購只是企業間常見的收購動作。但對于國內AI行業來說,這筆收購似乎預示著僅火熱半年的AI大模型創業潮正在降溫。
資本市場對行業水溫的感知更加直觀。自6月26日開始,科大訊飛、昆侖萬維、360等AI概念股集體大跌。
不只是國內,人們甚至對曾經趨之若鶩的ChatGPT也不再追捧。
根據網站數據分析工具SimilarWeb數據,前期ChatGPT的訪問量增長率驚人,1月份的環比增長率為131.6%,2月份為62.5%,3月份為55.8%,在4月份明顯放緩,環比增長率為12.6%,到了5月,這個數字只剩2.8%。
當大模型的熱度不再,人們很容易想到一個問題:大模型到底是不是創業的好機會?
這個問題顯然沒有標準答案,甚至連大佬之間的看法都大相徑庭。就在前幾天,獵豹移動董事長兼CEO傅盛和金沙江創業投資基金董事總經理朱嘯虎為此在朋友圈“吵”了起來。
大模型的認知矛盾并不只集中在個體身上。當創業者、投資人與需求方都存在認知偏差的時候,對于大模型的“謹慎與保守”,就成了絕大多數玩家的普遍狀態。
在6月16日召開的2023年華映資本年度大會上,華映資本投資人與被投的硬科技及消費科技企業之間,對產業如何擁抱大模型與AIGC的問題也曾展開過激烈的探討。
在「甲子光年」看來,大模型市場急需理性的聲音,創新的腳步不能停,諸多問題尚待厘清——大模型究竟能不能投?如何投?入局大模型有哪些問題?大模型未來的商業化前景到底是否會重蹈此前AI行業的覆轍?
無論人們多憂慮,產業擁抱大模型幾乎是既定結局——問題是,以什么樣的姿態擁抱。
1.謹慎的投資人們
百川智能、銜遠科技、聆心智能、西湖心辰、MiniMax……從2023年初至今,國內大模型創業公司層出不窮,每一位創業者的背景都足夠光鮮,每一家企業的實力都備受資本方認可。
那段時間,某某明星企業家離職創業入局大模型獲得巨額融資的消息屢見不鮮。
例如6月1日,有消息稱國內大模型初創公司MiniMax即將完成一輪超過2.5億美元的融資,公司估值超過12億美元;
而剛剛被美團收購的光年之外的融資消息在當時更是撲朔迷離,王慧文曾一度否認公司獲得了包括源碼、騰訊、五源以及宿華的2.3億美元融資,但這筆融資最終也因為美團發布的收購公告而坐實。
這種投資人追捧創業者的浪潮,讓人們一度以為大模型將要激活國內整個AI創投圈,但事實卻并非如此。實際上,除了自帶光環的明星團隊,投資人對大模型創業更多是觀望和審視,真正拿出真金白銀的人是少數。
早在今年初ChatGPT浪潮席卷全球時,「甲子光年」便第一時間和部分投資人們交流看法。那段時間,幾乎所有人都在快速學習,邀請專家對公司內部進行科普。
當時,AI領域熱烈討論著一個問題:ChatGPT是不是人工智能界的iPhone時刻?對此,險峰給出的答案是不急于下定論?!拔覀儠簳r還不能確定這個影響到底有多大,但我們認為它(大模型)肯定會改變一些東西?!彪U峰副總裁李抗說。
但也有投資機構對大模型表現了擔憂。某一級市場投資人對「甲子光年」表示,很擔心中國的反應過熱。ChatGPT爆發后,國內的AI概念股被引爆?!拔覀兊囊欢壥袌龆急仨毧紤]注入的相關投資能否產生相應的回報。如果都是為了短期利益,這種投資到最后很容易打水漂,因為你沒有真正去促進技術的發展,而是一個概念性投資?!?/span>
在他看來,投資人的關注點要聚焦,去探索更多對人類未來有影響力的基礎科學,這才是真正深藏潛在市場價值的科技力量?!凹纫褪袌鰟討B結合,也要和市場價值以及真正的、未來的社會進步結合,不能盲從,我們要清醒認識到哪些東西能改變未來,不能去蹭熱點,一窩蜂做這件事兒,我們不應該成為一個浪潮中的泡沫?!?/span>
不過,一位FA從業者向「甲子光年」表示:“最近慢慢開始有投資人出手大模型項目了,但手筆都不大?!?/span>
“本質問題還是認知不夠?!睂τ谕顿Y人們的謹慎態度,華映資本管理合伙人章高男給出了自己的理解。他進一步表示:“幾乎沒有人能清晰地定義大模型,我們要先把大模型的邊界定義清楚再來討論,你說的大模型與我說的大模型,很有可能都不是一件事情?!?/span>
在一些人看來,投資人的謹慎對大模型創業而言或許是一種負面信號,是在給大模型潑冷水。但客觀來看,謹慎不代表拒絕,經過深刻思考后的理性擁抱更為珍貴。
無論投資者還是創業者,又或是希望借助大模型將自身業務轉型升級的傳統企業,在真正投身大模型市場前都需要厘清兩個問題——大模型的能力邊界是什么,以及自身是否有必要引入大模型?
2.擁抱大模型前,厘清兩個問題
當一項新技術出現時,商業世界最核心的問題就是:這項技術能用在哪,怎么用?
這對大模型來說尤其重要,也是當前還未真正入局大模型的企業都應謹慎考慮的問題。
要回答這個問題,首先需要劃定大模型的能力邊界。
大模型的特殊之處在于,其內部的模型算法是一個巨大的黑箱,大模型的生成過程不可解釋且不可預測,因此很難界定其能力邊界。但可以確定的是,通用大模型不是萬能的。
智源研究院副院長、總工程師林詠華曾在一次分享中提到,從產業落地角度來看,“大模型+提示學習”無法代替一切。
她進一步提到,對于許多特定任務或新任務,提示學習或許能通過多輪提示prompt,讓大模型輸出需要的結果,但大模型“記不住”這個過程,而如果開發者把整個提示prompt都加到每一次的調用中,一方面有可能使得prompt越加越長而超過了大模型的上下文能力,另一方面勢必導致每次的推理開銷增大、效果也會難以控制。在投入了真金白銀的產品落地環節,這種不穩定性更為致命。
國家語音創新中心首席專家張熠天也在2023年華映資本的年會上表示:“大模型是一個生成邏輯,他給出的只是一個最優的詞匯梯次聚類,答案和問題之間并無因果。我們得到的東西只是一個'result',需要鑒別,而不是'answer'。所以大模型是否能夠直接在教育、醫療、司法等嚴肅領域應用,可能都是一個問題。但是它在輔助決策上,是有意義的。在直接生成結果上,如果要商業化、產品化,我們認為還是有很長的路要走的?!?/span>
因此,一個在業內基本形成的共識是,未來每個行業都會有一個自己的垂直大模型,重點在于如何將通用大模型的能力與企業自身的行業數據很好地融合起來。
但在真正考慮大模型工程落地前,創業者們還需要考慮一個更加重要卻很容易被忽視的問題——大模型是否是企業的“剛需”?
對此,國內一家多模態大模型團隊曾對「甲子光年」表示,大模型是否是企業的“剛需”需要多角度來理解。對于一些企業而言,沒有引入大模型,就相當于在市場競爭中失去了一把利刃,他們不得不上大模型來獲取客戶青睞——這也是一種“剛需”。
但某種程度上,這更多是新興技術在發展初期的一種市場情緒。長遠來看,新興技術的產業化發展,本質還是要靠業務需求驅動。這時,企業究竟是否需要大模型就需要考慮多重因素。
除了具體的工程落地問題外,企業還需要考慮數據安全問題,以及大模型對原有市場格局的影響。
這兩大問題在信息化、數字化時代已經頻頻出現且無法根除,智能化時代,這些問題則可能以一種更隱晦的方式出現。
“很多消費型、或者是平臺型的企業,如果毫無保留地去擁抱大模型,那大模型對行業的反噬能力是很強的,因為這意味著從產業端很輕易地就交出了行業的進入門檻和認知鑰匙?!睆堨谔毂硎?。
在數字化轉型的大背景下,大多數行業都通過大數據、云計算等技術實現了數字化轉型升級。但與此同時,傳統企業也向數字化技術廠商交出了大量的行業數據,數字化技術的提供商成為產業中一個不可忽視的主體,原有的市場格局被改變。
但工業、建筑等行業由于數據量小,且各業務線之間的數據難以打通,傳統企業至今仍保持著較高的競爭壁壘。
張熠天表示:“目前,建筑業是在數字化背景下被保護得最好的行業?,F在建筑業的信息化,除了一個廣聯達可以做預算以外,沒有一家巨頭能夠切入。為什么?因為建筑有設計圖、施工圖、維修圖、規劃圖、備案圖等八張圖,所有的圖之間相互都是打不通的,政府部門都不是互認的,打通整個建筑的這八張圖的成本足夠高,所以建筑業才保持了這種競爭主體的多元化。我們通常認為競爭主體的多元化是產業發展活力和動力之源?!?/span>
因此,在大模型浪潮下,對于行業標準、競爭優勢尚不完善的企業,是否要無條件擁抱大模型,是每一家都需要慎重考慮的問題。
3.大模型的工程化落地沒有標準答案
對于已經將真金白銀投入大模型市場的入局者而言,接下來要做的是解決實際的工程落地問題。
對此,業內已經逐漸形成一個共識——未來,在產業落地環節,大模型和小模型將會相輔相成。
林詠華曾表示,對精度要求高、對泛化能力要求低的窄域場景更合適“小模型+遷移學習”的范式。比如工業檢測、工業質檢、醫療影像分析等等。
此外,華院計算創始人宣曉華也曾表示,未來AI企業的商業模式,是將大數據驅動的通用大模型和以知識驅動的面向垂直行業的小數據模型相融合,實現雙輪驅動。
章高男也對「甲子光年」表示:“企業在做自己的模型優化或訓練垂類模型時,可以和大模型有所結合。不需要大模型那么高維的數據,也不需要完全套用大模型的訓練方法,但可以將大模型技術和其他技術耦合,形成低算力要求的行業垂直模型,這是有啟示作用的,絕不是簡單套用大模型?!?/span>
例如,對于大模型屢遭詬病的“幻覺”問題,短期內可能還需結合上一代AI技術來解決。
“產生幻覺的原因很多,可能是因為數據在某個領域相對稀疏和不足。在這種情況下,我們需要為模型提供更多數據來進行訓練。此外,在用戶提問時,清楚地向模型提供更多背景信息也是減少幻覺的一種方法,或者降低‘溫度’。有時候幻覺的產生是因為問題提得不夠完整,缺乏背景和前提。因此,問題的提出也非常重要,prompt engineering是關鍵。另外,如果用戶真的想要百分之百解決準確的問題,可能還是需要用到知識圖譜。知識圖譜能夠保證邏輯推理的準確性,以及包括Meta AI的負責人Yann Lecun提出的‘世界模型’等更新的技術?!苯痂志WCTO鄔學寧表示。
除和上一代AI技術相結合之外,將大模型的訓練過程與高質量的行業數據結合也是很重要的部分。
例如,作為一家為AI PaaS平臺服務的混布型數據庫,天云數據已經走過了十余年,如今已經走到了和大模型結合的階段。
天云數據副總裁李從武表示,將從兩個方面考慮自身與大模型的結合——首先是如何將私域數據與大型模型結合使用。例如天云數據為證監會完成了一個類似政策解讀的項目,通過結合法規、判例和解釋等各種數據,天云數據生成了對違規行為的解讀,類似于法院判罰的過程,可以通過綜合各種數據來解讀違規行為的原因。
其次,天云數據一直在研發混布式數據庫,是國內最早的幾家之一。早在2018年左右,天云數據就提出了AI native數據庫的概念,其實就類似今天支持大型模型的向量數據庫,天云數據已經發布了自研向量數據庫,并應用于自己的模型。
總的來看,大模型的工程化落地問題沒有標準答案。
在人工智能這條路上,中國一定會走出一條不同于別國的道路。兩條路很難有優劣之分,更多是基于不同國情下的現實選擇。
險峰副總裁李抗曾在訪談中向「甲子光年」做了一個類比,如今看來依然適用:“借OpenAI的成功去說國內創業者的諸多問題是不公平的,就像兩個人打牌,牌風不同,對方突然玩了一把大的,胡出了同花順,你就說人家打牌好,我太謹慎了,但我贏的時候你怎么不說?”
張熠天分享道,從中央的判斷來看,大模型,包括人工智能的問題,是贏得全球競爭主動權的重要戰略抓手,是推動我國科技跨越發展,產業化優化升級,生產力總體躍升的重要戰略資源。
“二十大報告談產業問題的時候,將人工智能從新一代信息技術中單獨提出。所以從政策上來看,發展人工智能、大模型,不僅僅是技術問題與產業問題,還是一個國家經濟核心競爭力的問題,從更深遠上看,更是一個政治問題,大家要從更高的角度來認識這個問題?!?/span>
如果將視野跳出中國,將技術發展的時間線拉長,ChatGPT引發的軒然大波或許只是人工智能技術發展歷史上的一個點,現在一切判斷都可能為之過早。
畢竟,即使是長期浸淫人工智能研究一線的技術人員,現在并未對人工智能的未來形成共識,并深陷于一種不安情緒中。
在近期爆火的《為什么偉大不能被計劃》一書中,肯尼斯·斯坦利、喬爾·雷曼兩位作者寫道:“我們不得不面對這樣一個令人不安的事實,即我們無法確定任何經驗法則能否成為追求實現人工智能目標的可靠指南?!?/span>
在前不久落幕的2023北京智源大會上,智源研究院院長黃鐵軍也有著極度相似的不安。他直接用“無法閉幕”4個字作為閉幕式的演講標題。他說:“我們處在一個不能確定的狀態,這樣的Near AGI它比我們強嗎?它超過我們的智能了嗎?還是它在什么時候能超過我們呢?我不知道,我們處在一個完全無法把控的狀態里?!?/span>
在閉幕致辭的最后,他用這樣一句話收尾:“如果我們能夠用投資大模型一樣的熱情去應對風險,至少有一定可能把握未來。但是,你相信人類能做到嗎?我不知道?!?/span>
放眼所有技術與產業,這種來自一線核心技術人員的“失控感”在其他領域并不常見?,F在,幾乎所有人都在摸著石頭過河。如今入場的每一家企業,都有可能成為技術處女地的拓荒者。
而時間,是證明一切的最佳憑證。