相信已經很少有人沒聽過“新質生產力”這個概念了。
今年兩會期間,“新質生產力”被寫入《政府工作報告》。近兩個月,社會關于“新質生產力”的討論愈演愈烈——究竟什么是新質生產力?新質生產力在實際場景中以什么樣的形態存在?大模型時代,又該如何充分釋放新質生產力?
這些問題各方都在討論,但更重要的是,“新質生產力”提供了一種全新的敘事,混雜著公眾的疑惑與期待,扣開了通往未來的大門。而火了一整年的大模型,成為“新質生產力”最具代表性的一個側面。
近期,甲子光年創始人&CEO 張一甲受百度智能云的邀請,與百度副總裁謝廣軍,必優科技創始人&CEO 周澤安進行了一次深度對話,試圖分別從模型供應方、模型使用方及第三方智庫的角度出發,回答關于“新質生產力”的一系列疑問。
百度智能云與必優科技均是各自所處賽道的“AI先行者”,他們活躍在距離“新質生產力”最近的地方,為“新質生產力”注入能量。
2023年3月,百度率先推出文心一言,是國內首家發布大模型產品的企業。當月,百度智能云發布全球首個一站式企業級大模型平臺——百度智能云千帆大模型平臺。2024年4月16日,百度智能云發布新一代智能計算操作系統——百度智能云萬源。
截止到2024年4月,百度智能云千帆大模型平臺已經服務超過8.5萬家客戶,平臺上已經精調出1.4萬個模型,并且開發應用數也達到了19萬的規模。
這些企業中,必優科技頗具代表性。
必優科技是一家典型的AI原生企業,其創始人周澤安此前在“AI+文檔”領域深耕多年。自2020年成立以來,必優科技已經在AIGC領域取得顯著成就,其代表產品ChatPPT在短短幾個月內,自然用戶量就突破200萬。百度文心一言和百度智能云千帆大模型平臺發布后不久,必優科技便于2023年4月成為百度智能云的首批客戶。
1.百度智能云需要必優,必優也需要百度智能云
大模型的生態必須足夠包羅萬象,才能承載用戶奇形怪狀的需求。
張一甲:你們雙方的合作是如何展開的?
謝廣軍:文心一言去年3月推出,4月就和必優科技達成合作。必優科技一直在“AI+文檔”領域持續深耕,能快速跟上大模型浪潮,我們是國內首家發布大模型產品的企業,自然而然地很快合作起來了。
張一甲:周總,合作中你是甲方,你們為什么選擇百度智能云?
周澤安:本質原因來自兩方面:
第一,我們產品的內在需求。我們2020年創業時還沒有大模型,我們自己做了一些簡歷、合同方面的小模型,參數規模都只有十幾億,甚至幾億。大模型出現后我們發現必須擁抱大模型,它的能力可以泛化到更多場景,這是我們的內在需求。
第二,百度本身的吸引力。文心一言推出后,我認為我們的用戶應該支持百度這樣的公司,他們敢于做第一家推出大模型的企業,一定有他們自己的準備。
張一甲:第一次看到大模型,你是什么心情?
周澤安:雖然我們之前也在做小模型,但我對自己和公司的定位一直是做應用。大模型作為一種更高效的生產力突然出現后,我毅然決然選擇擁抱它,放棄之前的包袱,用更先進的大模型解決用戶需求。
擁抱大模型也讓我的視野更開闊,之前我們做簡歷、合同更多是特定場景的特定文檔,做不了更寬泛的場景,很多需求對到我這邊,我解決不了,沒那么多精力,但有了大模型之后我們就能拓寬產品邊界。
張一甲:放棄小模型,擁抱大模型,你的團隊會有質疑嗎?
周澤安:剛開始團隊確實有一些心理波動,因為剛接入大模型不是那么穩定,且我們還沒有收到任何用戶反饋,步子是不是邁得有點大?是否應該等大模型成熟之后再去用。
但很快團隊就堅定下來了,最初選擇小模型是因為大模型不成熟,我們只能從細分領域切入,一塊一塊深耕,但如果有全新的生產力出現,整個范式都改變了,我們首先應該改變自己的思維方式。等大模型完全成熟再去用可能就晚了,因為在場景迭代和用戶的持續溝通,這本就是該有的產品應用“適應力”。
張一甲:你不光自己選擇了百度智能云,還帶著你的用戶一起選擇了百度智能云,會擔心百度智能云搶走你的用戶嗎?
周澤安:剛開始還是有蠻多顧慮,但觀望了一段時間,明白了通用模型與垂直場景的邊界感,加上我們一直堅持做文檔應用場景,我們還是篤信,大模型和應用場景之間是有一定距離的。我們需要大模型去重構產品,大模型需要我們去驗證應用價值。所以,我們和百度智能云之間更多是合作共生關系,他們也需要我,我們也需要他。
張一甲:大模型的生態必須足夠包羅萬象,才能承載用戶奇形怪狀的需求。也問下謝總,作為乙方,你認為百度智能云的差異化優勢是什么?
謝廣軍:AI原生應用的繁榮是我們最大的愿景。百度已經做了十幾年人工智能,是國內最早一批投入AI領域的企業。在文心ERNIE 3.0推出前,我們已經迭代了1.0和2.0版本。
今天的大模型to B領域,我們有四大優勢:
第一,覆蓋范圍很全,我們不僅能提供模型,還能提供訓練模型的一整套數據、工具鏈以及算力。
第二,模型效果很好。我們通過自身及先發用戶的使用反饋不斷迭代模型。尤其在中文語境下,不管什么測試,我們的模型都非常領先,泛化能力非常好。
我們在過去一兩年的實踐中,積累了很多用戶場景,有助于我們服務新用戶。在文心ERNIE 3.5和4.0版本的旗艦模型上,我們還做了一系列小尺寸大模型,比如ERNIE Speed、ERNIE Lite,甚至ERNIE Tiny版本,把小模型和大模型配合起來,為用戶降本增效。同時,結合我們的工具鏈,通過SFT、Post-pretrain(一種預訓練的模型訓練方法)等方式做有針對性的調優。
第三,我們針對成本問題做了很多優化方案,讓用戶以最低的成本,體驗到最好的性能。
第四,我們通過千帆AppBuilder,助力用戶低成本、低門檻地把大模型轉化成應用,不斷深耕各個領域,最終形成我們作為供應商的優勢壁壘。
2.大模型應用,如何落地生根?
真正的場景不是籠統的“辦公場景”“新能源場景”,而要觸達到用戶手邊的實際問題。
張一甲:作為應用方的代表,請周總談談必優科技在推進業務時遇到過哪些挑戰?
周澤安:首先是對“場景”的理解深度問題。
真正的場景不是籠統的“辦公領域”或“行業場景”這類泛詞,而是觸達到用戶手邊的實際問題,問題即場景。我們從22年12月就開始做ChatPPT,我們的定位不是“文檔智能體”概念,而是“文檔自動化(Document Automation)”。文檔領域的降本增效需要按業務步驟逐個解決問題,大模型只是其中一環,只不過當“自動化”因為大模型的決策與理解,最后形成了“文檔智能體(Doc-AI-Agent)”。
其次,我們之前對模型通用能力的認知也有一些淺層誤區。
PPT是一個很典型的多模態場景,文檔有圖有文字,還有數據,同時結合圖文呈現需求,還需要繪制、排版等能力,甚至連基礎的文本內容都要根據演講人的風格控制PPT整體的排版和結構。我們之前認為,一個場景中涉及到文字、圖片、視頻等模態就是多模態;但最真實的模型應用場景是,當用戶給一個需求,產品能直接生成一份符合用戶需求與預期的PPT,整個創作過程并不是由一個模型來決策,而是一個各種模型協作的結果,所以場景本身的價值是萃取出通用模型在具象問題上的輸出能力,并形成合力,從而解決用戶的問題。
張一甲:你們迭代產品的過程中,千帆大模型平臺提供了哪些具體幫助?
周澤安:我們一站式接入千帆大模型平臺后,可以輕松創建各類App。千帆大模型平臺打通了下游的開源模型、SFT、算力調度以及算力切片等服務,讓我們這些創業公司能夠更加回歸用戶體驗,聚焦產品能力的提升。
現在我們和百度智能云的合作已經上升到具體場景中的配合。我們使用文心大模型消耗的token中,接近40%都是用來做決策的。比如生成一個關于中國古代《清明上河圖》的PPT課件,我們會將用戶需求輸入文心大模型,文心大模型會給出若干選擇,從文風到設計風格,我們會根據文心的反饋來決定下一步配色和排版內容的定義。后續再經過多輪調用后,最后才能真正生成符合用戶需求的PPT。
張一甲:某種程度上,用戶的需求在倒逼你們雙方的合作更加深入,在場景層面進行共創,一直合作背后實則是一行一行的指令交互。
謝廣軍:是的。通過合作中的深度交互,我們也把這套模式沉淀到百度智能云的后續產品中,讓我們的能力泛化到PPT、文檔生成之外更多的場景中,形成“思考+生成”的落地模式。
張一甲:大模型的技術路徑在持續迭代,例如今年各家都開始卷起了長文本。百度智能云作為模型供應商,如何判斷下一步做什么,不做什么?
謝廣軍:我們的著力點主要圍繞大模型落地的幾個門檻:首先,模型價格還可以繼續降低;其次,模型效果也有持續的迭代空間;第三,模型還需要積累更多場景應用的經驗;第四,應用開發和調優的成本需要進一步降低。
張一甲:訓練大模型需要大量投入,有人花錢招人,有人花錢買卡,百度怎么算經濟賬?
謝廣軍:大模型帶來的影響堪比工業革命,我們首先要把大模型做好,這有助于我們的業務拓展。雖然前期會有大量投入,但隨著大模型市場規模不斷擴大,模型訓練成本會被逐漸攤薄,推理成本也會不斷優化。從文心一言發布到現在,我們今天的推理成本只有第一天的1%。
張一甲:這個數字非??鋸?,你們如何降低推理成本?
謝廣軍:除了優化模型本身,我們還會深入場景,結合用戶需求提供最低成本、最有性能的解決方案——有些需求可以用小尺寸模型來解決大部分問題;有些需求則需要通過用戶數據精調專家模型,讓專家模型和通用模型配合,以MoE架構降低推理成本。
張一甲:今天大模型落地進展如何?
謝廣軍:我們經常會舉一個形象的例子,四川有一種竹子,叫毛竹。這種植物生長的前幾年只能長十幾厘米,這段時間它的根系會在地下蔓延數十平米。這個階段過后,毛竹會肉眼可見地快速生長,一個月能長十幾米。
大模型的應用落地也類似,現在大家都在探索,如何通過大模型解決實際問題?有哪些業務可以用大模型創新?雖然我們還沒有看到大模型翻天覆地的應用,但過去一年,大模型已經開始扎根行業、快速滲透,出現越來越多的應用,這里的"應用"不僅是指一款獨立的App,更是指通過大模型做的業務改造和升級,影響研產供銷服的各個環節和我們生活的方方面面。
去年3月底,我們發布了百度智能云千帆大模型平臺,到現在正好一年多時間。過去一年,千帆上API的調用量呈現了指數級增長的趨勢?,F在已經有超過8.5萬的客戶在使用千帆,累計精調了超過1.4萬個模型,開發了19多萬個應用,分布在各個行業,可見,越來越多的企業已經把大模型真正用起來了!一旦突破天花板,整個社會的智能化水平會有巨大提升,到時候大模型to B會迎來一個非常好的契機。
周澤安:我的判斷和謝總類似,大模型的商業閉環還處于驗證階段。我們2023年3月發布產品后,5月就開始商業化測試,出現過一段收支不平衡的時期。因為大家都在快速發展,當用戶規模擴大,我們要給用戶一定的空間去試錯,在這個探索期我們不得不把商業化節奏放慢一點,否則很難建立起用戶心智。
張一甲:必優科技接下來有哪些業務規劃?
周澤安:我們內部有三個業務發展視角:首先,用戶需求導向,從用戶需求中萃取下一步業務進化方向,例如在文檔生產鏈路中引入“角色”的概念,不同的AI角色決定內容形式與風格;第二,緊跟市場趨勢,尊重技術同頻和價值同頻;第三,結合我們此前積累的行業know-how,持續專注自己“最擅長”的文檔場景,不斷迭代產品。
今年6月我們預計會發布一款真正的live document產品,它比ChatPPT更加極致,更加依賴AI大模型。我們提出了一個全新的文檔呈現概念,叫Model to View或Data to View。
新產品會回歸內容本質,內容表現形式不再局限單一了,它可以因用戶場景需求即時、瞬時呈現對應的內容和形態。比如當用戶需要在某個場合演講,我們的產品就切換為一份相對簡潔且富有邏輯表現力的PPT;而下一秒如果用戶需要給老板做匯報,它可能就會展示出更加詳盡的word文檔形態,有解釋,有說明,AI驅動,瞬時創作。
3.AI原生應用就是一種新質生產力
新質生產力要解決兩個核心問題:第一,降本增效;第二,通過新技術催生新的應用場景和工業化生產模式。
張一甲:今年,“新質生產力”被寫進了政府工作報告,它的內涵和外延是什么?
謝廣軍:大模型的落地應用本身就是一種新質生產力。我認為新質生產力要解決兩個核心問題:第一,降本增效;第二,通過新技術催生新的應用場景和工業化生產模式。
張一甲:百度智能云在新質生產力中扮演什么樣的角色?
謝廣軍:目前,圍繞文心大模型底座,我們已經打造了“百舸”算力異構平臺、千帆ModelBuilder和千帆AppBuilder。上個月的Create大會上,我們新發布了“萬源”人工智能操作系統。我們希望這些產品成為新質生產力本身,成為中國產業數智化升級的動力引擎。
張一甲:為什么會推出“萬源”這種操作系統類的產品?
謝廣軍:今天的大模型底座需要解決幾件事:
首先,大模型底層需要分布式的異構算力支撐,動輒要驅動萬卡GPU集群,容易出現機器故障?!鞍亵础本皖愃拼竽P筒僮飨到y的驅動器,管理了很多硬件,充分發揮硬件價值。我們為此定義了一個指標,即“訓練有效性”,用來監測硬件是否在處理用戶訓練的任務,而沒有閑置。目前,我們的萬卡集群的利用效率已經達到98.8%,最初只有50%。
今天,大模型已經成為操作系統的內核。模型的效果和效率,已經成為AI應用的核心決定因素。“萬源”操作系統的內核就是“文心”系列模型;千帆ModelBuilder,是指在操作系統之外進行模型管理的shell,可以通過它進行SFT,做數據增強和模型評估。ModelBuilder之上,還要有開發應用的編程接口和工具,為此我們推出了千帆AppBuilder,進一步降低應用開發的門檻——從算力、模型到應用整體形成了“萬源”操作系統,支撐各種AI原生應用的開發、運行和效率優化,這就是“萬源”的含義。
張一甲:請問周總,AI原生企業在構建新質生產力的過程中會扮演什么樣的角色?
周澤安:在我看來,新質生產力即全新的、高質量的生產力。上一個時代,我們解決文檔場景的某個問題,更多是優化界面的某個按鈕、提示或工具欄,讓用戶自己解決自己的需求。但未來,用戶對降本增效的需求一定更高,需要從重構解決問題全新產品思維,且能夠擁有高質量的生產力方式,才有可能真正解決用戶的問題。
張一甲:未來3-5年,二位對人工智能的發展有哪些期待?
謝廣軍:我們希望通過更好的技術,提高各行各業的生產生活效率,同時有新的AI原生應用爆發。
周澤安:我希望在業務層面出現更加普惠且通用的多模態模型基座。