擁有海量的高質量數據是企業在AI時代中立足的核心優勢。
作者|甲小姐、蘇霍伊
編輯|劉楊楠
“生活在科技大爆炸的時代,無論是創業者、投資人還是科技媒體人,我們都是幸運的?!盕usion Fund創始合伙人張璐感慨道。
過去十余年,張璐見證了硅谷從互聯網時代到AI時代的變遷,她的成長經歷決定了她面對技術浪潮時的豐富視角。
她是一位成功的連續創業者。張璐畢業于斯坦福大學材料科學工程學院,自2010年起就扎根硅谷。碩士畢業后,她賣了自己創辦的醫療器械公司,轉身創辦Fusion Fund基金,那時的張璐年僅24歲。
她也是一位經驗豐富的投資人。從AI in Healthcare到企業級AI及工業數字化,張璐很早就確立了以高壁壘的科技創新投資為核心的理念。目前,Fusion Fund管理資金規模近4億美元,業績位居硅谷投資機構前列。
今天,站在歷史的橫截面上,張璐深感硅谷的創新氣氛正發生著微妙變化。一切都更快了,很多新的技術創意一夜之間就能從實驗室走向市場。最直觀的表現是,張璐的說話語速都更快了。
關于未來,張璐認為,人工智能的生產力賦能才剛剛起步(just get started),而海量的高質量數據就是企業在大模型時代立足的核心。
6年前,我曾與張璐有過一次對談,主題是“to B投資之道”。當時張璐表達:
“創新的周期性是‘基礎技術創新-技術應用創新-商業模式創新’,前兩步造蛋糕,最后一步分蛋糕。當蛋糕分無可分了,下一步當然是得重新技術開荒。這是一個螺旋上升的過程。在這種歷史的螺旋式的上升規律里,識時務者為俊杰,一定要順勢而為?!?/span>
6年后的今天,世界來到AI的無人區,每一位局內人都是未來的“開荒者”。我再次與張璐相約,聊聊AGI這塊蛋糕該怎么造、怎么分。
1.談感受:“對生態系統、行業格局和產業聚焦的共識越來越多”
監管很重要,要制定合適的規則,確保技術發展貼合人類利益。
甲小姐: 之前每次見你,你都說“今年是最忙的時候”,今年會更忙嗎?
張璐: 去年很忙,但今年確實更忙,是持續打雞血的狀態??萍碱I域幾乎每天都有新事物出現。以前學術界的研究成果轉化為實際產品需要很長時間,現在轉化速度非???。新技術在硬件、軟件、基礎設施等層面不斷涌現,推動了AI應用和產業的多元化,既如火如荼,又眼花繚亂。但在應用層和底層,人工智能的大規模落地仍面臨算力、耗電量、隱私、延遲等問題。這是挑戰,也是大機會。
甲小姐:感覺你今年說話語速都更快了。
張璐:最近每天從早上七八點開始工作,晚上10點半左右才結束。作為創始人,我是沒有周末的,周末主要是處理團隊和公司事務或會見教授和科學家們。
我們整個團隊也都興奮起來了。我的合伙人們經常調侃,白人不像亞裔那樣是“工作狂”。但現在他們下班后依然會在WhatsApp上討論工作。
甲小姐:今年硅谷投資圈的共識和爭議哪個更多?
張璐:共識越來越多,共識在于對生態系統和行業格局的判斷和產業聚焦。大家探索后逐漸認清市場的真機會,而抓住機會的公司也得到了更集中的資源,獲得更快的成長。
甲小姐:硅谷近期討論最多的話題是什么?
張璐:其實關于“AI擁有意識后能否與人類利益保持一致”的討論很多。一個更深層次思考是——我們距離AGI還有多遠?我個人認為短期內人工智能仍是“沒有意識,只有智能”的工具。我更好奇如果AI獲得了自我意識,它是否會誕生出自己的語言,進而形成文明?
甲小姐:你的表述很像科幻小說家特德·姜的小說《領悟》中的角色,他在服用“聰明藥”后智力不斷提高,逐漸發現人類語言已不能表達他的思維,最終創造出一個融合數學與物理公式的語言體系?;蛟S在一個隱秘的運作空間中,AI采用的邏輯已經超出了我們的認知范圍。
張璐:是的,所以監管很重要。任何新技術都需要監管,尤其是AI這種超級工具。當前的AI監管主要集中在數據上,如B端的醫療、金融、保險等高監管行業的核心就是把控數據。
我們需要明確發展AI會帶來的潛在風險,如果不對使用者或相關數據設限,很可能會導致失控。但這是持續探討的過程,不是要放慢技術進步的腳步,而是制定合適的規則,確保技術發展貼合人類利益。
2.談路徑:“生成式AI是構建世界模型的可選項,而非必選項”
我們需要對未知保持敬畏,人類對世界的認知還有很大的提升空間。
甲小姐:你怎么看OpenAI實現物理世界模擬器的目標?
張璐: 不同的人對人工智能的定義理解不同。
目前人類對腦神經科學的了解是有限的。大腦是世界上最高效的機器——高效率低能耗,還具有意識和潛意識之分。潛意識在我們用意識決策時,無意識地捕捉、分析并生成數據,形成所謂的“第六感”。
科研在不斷拓展我們對大腦的認知?!禢ature》雜志在去年12月研究表明,在大腦中新發現的神經元系統——神經肽,而神經元間的通信并非都需要直接接觸,而可以像Wi-Fi一樣遠程傳輸信息。
上一代的人工智能專家多是數學和物理背景的,但現在越來越多的人工智能專家是腦神經學背景。因為我們開始意識到大腦不只是一個簡單的器官,而是奇妙生物。隨著我們對大腦復雜性的了解逐步加深,我們更能改進AI技術。
我們需要對未知保持敬畏,人類對世界的認知還有很大的提升空間。人工智能還沒有發展出類似人類的意識和潛意識,AI在這方面的輸入和模擬可能還不成熟。我認為世界模型還未誕生,但我們正朝著這一目標前進。
甲小姐:你最看好的通往世界模型的技術路徑是什么?
張璐:我相信技術發展和數據提供了多種可能性,并非只有一條路徑。Meta和其他公司正在探索不同的方法來構建世界模型。方法可以是“自下而上”或“自上而下”的。Sora的做法可能更像是自下而上的;另一種是從已知的物理定律出發,自上而下地去理解和構建世界。我相信,這兩種方法都有可能成功,但我們對世界的理解可能還不足30%,這是一個持續演進的過程。
甲小姐:我同意你的觀點,單一的路徑不能完全模擬世界,但Sam Altman等極端的技術理想主義者認為,應該堅持一條路走到黑,你怎么看?
張璐:有這種可能?,F在最讓人興奮就是未來充滿可能性。我在與頂尖專家交流時,他們對未來的技術架構也沒有確切的構想,我們需要在不同技術方向上進行嘗試,正如我們之前沒有預料到大模型在編寫代碼方面的能力。目前產業正在探索多種路徑,這也為投資提供了多樣化的選擇。
甲小姐:在電影《降臨》中,不同物種可能有不同的物理體系,這意味著有多種方法可以逼近世界模擬。物理世界的“模擬器”并不等同于“理解器”,但今天的大模型依然有嚴重的“幻覺”,是否意味著,今天的AI不適合處理理工科模擬和預測問題,只能局限于需要隨機實驗和啟發性結果的領域?
張璐:我認為并非所有情況都需要使用生成式AI。不同的模型和技術路徑將適用于不同的應用場景,生成式AI是構建世界模型的一個選項,但并不是唯一選擇。比如英偉達曾經開發了一個成功的全球氣象模型,這個模型利用合成數據平臺成功構建了工業和產業生態,包括地球氣象的模擬。
甲小姐:目前,實現AGI的技術路徑依然沒有“大一統”對嗎?
張璐:是的,整個人工智能趨勢都是剛剛起步(just get started)。在這一階段,盡管某條技術路徑的初步嘗試取得了成功,但同時也面臨成本、算力等挑戰。也許就存在另外一條路能夠解決成本和算力的問題。
另一個考量是,應該優化哪個參數?優化模型時不僅要考慮高精準等因素,更要考慮成本。比如對不追求時效的用戶而言,3分鐘或3小時生成一個視頻沒差別,那花費巨大算力成本追求快速生成視頻就不值得,這類問題在未來商業應用中都該考慮到。
3.談投資:“醫療的未來是個性化,而個性化的核心是數字化,這都需AI技術驅動”
技術本身固然重要,但成本和應用場景的實際需求才是投資的首要考量。
甲小姐:目前AI在商業應用方面,有哪些投資機會?
張璐:之前提到,人工智能是所有產業都該應用的超級工具,但不代表每個產業都能產生大規模的商業投資機會。
應用層首先要有海量的高質量數據,篩選后會發現有醫療、金融、保險、物流供應鏈和化工等行業,它們數據的擁有方不是科技公司,初創企業反而更有優勢獲得優質數據。而AI作為撬動的技術杠桿,能幫助好應用做起來。
此外還有機器人(robotics)和太空數據。得益于人工智能的進化,機器人技術進入新時代。而AI進化過程中訓練數據的形態和屬性很重要。盡管目前數據資源豐富,但公益數據可能在未來幾年內耗盡。
為了增加新生成數據的多樣性,我們就需要有更強大的感知和收集數據的入口。目前收集的數據主要是文本、語音和圖片,但人類接收的數據類型遠不止這些,還包括感知數據、磁場數據、情緒數據等。
所以我們主要有兩個需求:一是需要機器人和傳感器收集廣泛的數據;二是發展更先進的感知技術獲得多樣化數據。
而太空數據是稀缺的。有些公司專門處理太空中的衛星交通數據,這些數據價值極高。它們通過管理、交易和分享太空數據,最終形成了太空數據經濟體系。太空數據是潛在的寶藏,在AI的加持下,能挖掘出獨特且有價值的垂直領域應用,我們也投資了很多太空科技公司。以上是應用層的機會。
此外,在AI基礎設施(AI infrastructure)層包括芯片層、網絡層、軟件層和數據層,對應人工智能應用面臨的四大挑戰:算力成本高、耗能大、延遲問題以及數據隱私問題。
所以我們除了投資專注算力優化、降低能耗方向的公司外,從2018年就投資了邊緣計算,人工智能的未來是AI on the edge,邊緣計算的優勢有:降低能耗,無需將所有數據上傳云端;減少延遲,邊緣計算能實現本地即時反饋;以及在數據隱私層面的優勢。
當我們把市場格局理清,投資路線和思路也會清晰起來。
甲小姐:有人認為當前是OpenAI一騎絕塵的市場格局,而你呈現了另一幅充滿想象和多角色融合的場景。
張璐:自2017年起我們便把AI作為重點投資賽道,同年我們發布了《AI人工智能在醫療領域的應用》。我最初做醫療器械起家,后來轉向深科技和醫療投資。之前的經歷讓我意識到,醫療的未來是個性化,而個性化的核心是數字化,比如數字診斷等,都需AI技術驅動。
從產業角度考察技術,可以確保投資項目的實際性和可行性。技術本身固然重要,但成本和應用場景的實際需求才是投資的首要考量。市場眼花繚亂,就要求早期投資人和早期創業者,一定要擦亮眼睛,在市場空間層面上找到真正的機會。
甲小姐:整體概括一下,當前AI生態中有哪幾類玩家?
張璐:主要有三類企業。
第一類是不盈利的模型公司。它們背靠亞馬遜等大型云服務公司的支持,比如OpenAI等公司。
第二類是用大模型作內驅力的企業。如Salesforce、蘋果和英偉達等,它們開發了出色的大模型僅供內部或只在自家產品上使用,而非獨立銷售的產品。
尤其值得關注的是蘋果,它在AI芯片、云服務、算法和數據方面實現了垂直整合。蘋果是最容易做系統優化的公司,實現降本增效的系統優化。
在芯片層提高20%的效能和降本20%只是芯片單層的改進;OpenAI在模型層面提升是模型單層面的改進。而蘋果如果在每層提升5%—10%,疊加的優化效果將十分驚人。
第三類是開源模型。OpenAI的“暴力美學”的方式未能一統江湖,整個生態呈多樣化,Meta就是開源生態的突出貢獻者。
甲小姐: Meta、Google、微軟等巨頭在硅谷的人工智能生態中扮演什么角色?
張璐:這些巨頭在內部人工智能應用和推廣外部產品方面都進展飛快,但它們并非“能做就全做”,而是采取長期的生態系統思維,讓初創企業在生態中快速成長,轉而成為其中的貢獻者。
大科技公司和初創企業都致力于通過商業應用來優化和改進生態系統。我們相信這種模式會推動更高效、更低成本的視頻和語言模型誕生。因此我看好開源領域,尤其是Meta和Google,它們都為開源生態做出巨大貢獻。
甲小姐:你們似乎一直很重視開源?
張璐:是的,因為我們團隊的優勢就在于生態網絡。我們投資的一些公司由使用OpenAI的API轉向開源模型,像Mistral等開源模型都表現出色。去年9月,我們投資的一家公司發布的開源模型在多個專業任務上超越GPT-4,當時在Hugging Face上排名第一。Hugging Face的CEO Clément Delangue也在X上推廣它。
我由衷希望大家多關注開源。許多優秀的開源模型是華人團隊開發的,這些模型經過中英文雙語訓練的,利用中文的多樣性、獨特性讓模型更優化,我的合伙人之一Trevor Mottl就在積極探索開源模型。
4.談創業:AI創業公司僅有C端市場10%的機會
擁有海量的高質量數據是企業在AI時代中立足的核心優勢,且數據的質量比數量更重要。
甲小姐:對創業公司而言,如何更好地在這波大模型浪潮中立足?
張璐:首先,這波AI趨勢的真實性毋庸置疑,且量級可能是互聯網時代的十倍多,涉及全產業數字化轉型。
擁有海量的高質量數據是企業在AI時代中立足的核心優勢,且數據的質量比數量更重要。以前由于缺少數據和數據共享的渠道,我們無法集中訓練所有數據?,F在數據量、數據質量和數據獲取的渠道都已就緒。數據的可用性和技術的進步讓產業看到零代碼AI平臺的潛力,這也是我從2017年就強調的概念。
比如醫療,我看好醫療是因為醫療數據大多不在傳統科技公司手中。因為擔心數據被用于商業目的,這些企業不會將數據分享微軟、Google等公司,它們更傾向于采納新技術來內部實現AI賦能,并傾向于與初創公司合作。但同時,大科技公司也開始認識到數據價值的,并探索建立自己的數據戰略。
甲小姐:大企業為什么不自己處理數據?
張璐:主要出于對敏感數據的擔憂。特別是處于高度監管行業的公司,數據處理不當可能會面臨嚴重的追責。此外,具有深度技術背景并懂大模型的人才是稀缺的。
甲小姐:目前整體的AI人才畫像如何?
張璐:AI公司的人才可以分為兩類:一種是做應用的,這類公司的成功很大程度上取決于能否拿到數據。在這種情況下,有經驗的連續成功創業者可能更容易獲得信任和高質量數據。另一種是做AI基礎設施的公司,需要創始人具有強烈的創新思維,這時年輕的創業者就更有優勢,因為他們沒有被現有架構的束縛。
去年可能是我投資公司數量最多的一年。在我投資的應用層公司中,有三分之二是連續成功創業者;在做新基礎設施的公司中,連續成功創業者和年輕的創業者各占一半。兩邊都有機會,重要在于創始人需要清楚自己的優勢,并選擇適合自己的創新方向。
其次,人工智能領域的初創企業人力成本正在降低,因為現在可以采用倒金字塔結構,高層由少數資深人員帶領,執行層面由少量年輕工程師和AI輔助工具(如copilot)構成。這種結構下初創企業不需要大量的資金和資源,但對于資深人才還是需要與大科技公司搶奪的。
甲小姐:資金和人才會趨向于集中流向少數熱門領域嗎?
張璐:我認為不會。大模型公司更像是熱帶雨林地下的真菌網絡,為整個生態系統提供支持。在這個網絡之上,能生長多樣化的公司。
甲小姐:OpenAI采取了“暴力美學”的策略,通過大量參數訓練出領先的產品后,再考慮如何大幅降低成本,初創公司應該先對齊OpenAI的技術水平還是先解決各自的問題?
張璐:初創公司應先對齊OpenAI的技術水平,再考慮優化。初創公司可以通過技術,如微調來有效控制成本并減少算力需求。重要的是,人工智能尚未有統一標準,一切“just get started”。
甲小姐:初創企業的機會在B端更大還是C端更大?
張璐:To B領域的需求與To C領域大相徑庭。
相比之下,C端對技術的要求最高。這也是我們時常遺忘的,人的需求是多樣的,人會有復雜的問題和需求。所以To C端產品需要覆蓋廣泛,要能回答“如何用拖鞋和籃球、梨制作一道菜”這樣不可預測的問題。
但專注度是To B領域發展的關鍵。
例如在醫療領域,我們投資的公司不需要有像Sora這樣的技術,他們只需用生成式AI制作醫療影像一旦獲得FDA批準即可銷售;
在教育領域,AI也為教育帶來了新的工具。在斯坦福等頂尖大學,教授們開始鼓勵學生利用AI來完成作業,并分享他們如何更有效地使用這些工具,人們開始意識到,提問的能力比回答問題的能力更為重要,因為好的提問可以引導出更深入的答案。優秀的提問技巧和思維方式,也是我們教育未來應該培養的方向。
目前,消費級AI中90%的機會都在大科技公司手中,因為它們掌握著數據。它們在“ABC”三方面具有優勢, A是algorithm(算法),B是big data(大數據),C是computing power(算力)。但對于初創企業而言,剩下的10%的機會也足夠大。初創企業在C端市場難以與Meta、Google等競爭;而在B端市場,尤其是科技驅動的SaaS賽道,同樣需要面對Salesforce和微軟等的壓力。
甲小姐:你認為目前創業公司最大的挑戰是什么?
張璐:算力成本高昂,模型公司基本不盈利。
以Sora為例,Sora驚艷的背后有個未被提及的關鍵問題——具體成本,包括算力成本和擴展成本。Sora生成一分鐘視頻需要耗費大量時間和算力,在同等產品效果下,如果Sora的成本遠高于傳統人力成本,用戶極大可能不會AI生成視頻的方式。
目前,AI發展的最大瓶頸可能也不是模型本身,而是算力資源不足。OpenAI、Google等科技巨頭也面臨GPU資源緊張的情況。GPU本身并非專為處理生成任務而設計的,短期內難以找到替代品。
甲小姐:你曾表達:“投資者應該更關注解決方案,而不是問題本身?!痹贕PU的問題上,你看到了哪些解決方案?
張璐:目前,半導體公司TSMC正在建設新工廠,用于在N2制程芯片的量產,預計這些新工廠將在2025年下半年開始大規模生產。英特爾也在推進其先進的制程技術。挑戰也意味著機遇——在未來,減少對GPU的依賴和優化使用效率是行業的重要發展方向。
還有GPU的能耗問題。我們投資了部分能大幅降低數據中心能耗的公司,這些公司最多能將能耗降低至原來的1%。
5.談未來:“大企業競爭有利于生態搭建,普通人要擁抱新技術”
我們不應將新技術視為威脅,而是把它看作一個機會。
甲小姐:預判一下,2024年AI領域會有怎樣的milestone(里程碑事件)?
張璐:許多大科技公司逐漸都會有大的發布,原本較為被動的大科技公司現在正積極參到競爭中,這對科技生態是十分利好的。他們在算力和基礎建設方面大力投入,并為小公司提供了低成本的API。生活在科技大爆炸的時代,無論是創業者、投資人還是科技媒體人,我們都是幸運的。
甲小姐:你認為下一個大火的細分賽道會是什么?
張璐:醫療。
甲小姐:中國市場和美國市場的AI需求分別是什么樣的?
張璐:中國市場和美國市場對AI需求不同。在美國,AI機會更傾向To B。尤其在OpenAI DevDay的舉行和Sora出現后,讓初創公司意識到與大公司在C端市場的競爭艱難。
甲小姐:關于社會普世價值,AI的進一步的發展會進一步加大數字鴻溝嗎?
張璐:我覺得不一定。關于人工智能對社會的影響,并沒有一個簡單的答案。短期內,大品牌和科技巨頭會被AI更快更多地賦能,同時技術正朝著降低使用門檻和使用成本的方向發展。
未來技術為我們提供了更多表達自我的方式。就像電影之所以有強大的影響力是因為它具備講述故事、與觀眾溝通的能力?,F在每個人都有機會創造出有影響力的內容。在相機出現前,如果沒有繪畫技巧,我們很難將美景和理念呈現出來;而如今只要有發現美的眼睛,我們就可以通過相機或手機捕捉到這個瞬間,這正是技術帶給我們的新可能性。
在談到數據鴻溝時,確實有算法能幫助我們解決這個問題,比如我們投資的公司Federal Learning就在做這件事。所以不只是大型語言模型或生成式AI,還有其他的算法模型也在致力于解決我們面臨的挑戰。
甲小姐:你對AI時代的我們有什么建議?
張璐:在中國,各行各業的對人工智能的興趣和關注度都非常高。我們需要持續關注并使用這些AI工具,并保持開放心態,思考如何將這些工具應用于日常生活中,并最終實現自我賦能。
華人科學家李飛飛教授曾說過:“人工智能替代掉的不是工作,而是項目?!北热缛斯ぶ悄芸赡軙娲o士職務的50%,這實際上是對護士職業的賦能。我們不應將新技術視為威脅,而是把它看作一個機會。