OpenAI即將成為蘋果后發優勢中的一環。
作者|王藝
編輯|王博
在蘋果公司取消造車計劃,轉而投向生成式AI后約三個月,蘋果終于要在自己的終端產品上應用AI模型了。
長期跟蹤蘋果的彭博新聞社記者馬克·古爾曼(Mark Gurman)當地時間5月26日爆料,經歷了為期兩個月的談判后,蘋果已與OpenAI達成協議,將后者的聊天機器人ChatGPT集成到iOS 18,雙方的合作伙伴關系預計將于6月的蘋果全球開發者大會(WWDC24)上官宣。由于不放心讓OpenAI成為iOS一項主要新功能的單一供應商,蘋果仍在努力與谷歌達成協議,希望Gemini可以作為一種選擇。
此前,蘋果已經推出OpenELM、MM1、Ferret、Ajax等多款AI模型,但這次古爾曼爆料的焦點并不在這些蘋果自研AI模型上,似乎蘋果更相信外部更成熟的AI模型及其產品。
但蘋果在生成式AI時代已經遲到了。
去年5月,蘋果公司CEO蒂姆·庫克(Tim Cook)就曾表示,AI的潛力“非常有趣”,但他表示該技術存在“許多問題需要解決”。他解釋說,在決定如何以及何時使用AI時,“深思熟慮非常重要”。
過去的一年,華爾街的分析師一直在抱怨蘋果沒有AI故事可講。今年5月2日,在2024財年第2財季(今年第1季度)財報的電話會的問答環節,每一位提問的分析師都在問有關AI的問題。但除了之前的評論外,庫克幾乎沒有透露蘋果未來的AI功能或服務,也沒有透露蘋果如何利用它們賺錢。
“我不想搶在我們發布公告之前發表言論,”庫克在電話會上說,“我們認為生成式AI是我們產品的一個關鍵機會,我們相信從理論上講,我們擁有與眾不同的優勢。我們將在未來幾周內進一步討論這個問題?!?而庫克近期在接受路透社采訪時則表示:“我們仍然對生成式AI領域的機遇非常樂觀,并且正在進行大量投資?!彼赋?,該公司過去五年已在研發上投入了1000億美元。
盡管蘋果在生成式AI時代姍姍來遲,但蘋果依然擁有后發優勢——龐大的用戶基礎、完善的產品生態以及軟硬一體的范式。
在近期舉辦「AI創生時代——2024甲子引力X科技產業新風向」大會的巔峰論壇上,出門問問創始人兼CEO李志飛就表示:“大公司跟小公司是完全不一樣的。我覺得對于大公司來說,后發可能是優勢,尤其是做大模型的?!?/span>
在生成式AI領域,一方面,AI似乎有先發優勢:先行者可以有數據飛輪;另一方面,AI似乎有后發優勢:后來者的投入產出比更劃算。
一直在AI領域占有先發優勢的OpenAI,即將成為蘋果后發優勢中的一環,而OpenAI也想借助蘋果的后發優勢,尋求更大的增長機會。
1.“雖遲但到”的決定
OpenAI發布GPT-4o后,就有網友評論,蘋果的語音助手Siri可以下崗了。
作為一款“原生多模態大模型”,GPT-4o所有輸入和輸出都由同一個神經網絡處理,這使得GPT-4o能夠接受文本、音頻和圖像的任意組合作為輸入,并輸出文本、音頻和圖像的任意組合,是兼具了“聽覺”“視覺”的多模態模型,同時還支持中途打斷和對話插入,且具備上下文記憶能力。
OpenAI官網博客顯示,GPT-4o在談話中對音頻輸入的平均響應時間為320毫秒,最短的響應時間為232毫秒,與人類的響應時間相似。
值得注意的是,OpenAI在演示GPT-4o時使用的是iPhone,以OpenAI的野心和能力,絕不僅僅只是想做一個APP,而是想進入整個蘋果生態——OpenAI需要通過蘋果來突破用戶增長瓶頸。
OpenAI總裁格雷格·布羅克曼(Greg Brockman)演示GPT-4o功能,圖片來源:OpenAI
在GPT-4o發布前,ChatGPT已經歷了一年左右的流量增長困境。隨著GPT-4o的發布并接入ChatGPT,ChatGPT本月有望創下網絡流量的新紀錄。
SimilarWeb數據顯示,今年5月的前三周,ChatGPT網站平均每日訪問量約為7700萬次,本月總訪問量有望超過23億次,而此前的月訪問量峰值為18億次。
流量來了,OpenAI自然想趁熱打鐵,蘋果就是其重要目標。正如英偉達高級研究科學家Jim Fan所說:“誰先贏得蘋果,誰就贏得了勝利?!?/span>
不過OpenAI對端側的“覬覦”其實早有端倪。去年秋天,科技媒體The Information就爆料,OpenAI CEO 薩姆·奧爾特曼(Sam Altman)與蘋果公司原首席設計官喬納森·伊夫(Jony Ive)正在合作開發一款的AI驅動的消費設備。這家初創公司目前正在與一些風險投資界的巨頭進行融資談判,其中包括Emerson Collective和OpenAI的主要投資者Thrive Capital。
OpenAI剛剛走出增長困境不久,蘋果則還在經歷增長困境。
蘋果公司發布最新季度財報顯示:今年前三個月,實現營收907.53億美元,同比下降4%。
去年開始,華為、榮耀、小米、OPPO等手機廠商都開始積極嘗試AI大模型落地?,F如今,生成式AI已經成為手機產業鏈角逐的一個新賽道,而蘋果這條賽道的步伐顯然慢了競爭對手幾步。IDC中國區副總裁王吉平曾對媒體表示:“有AI加持的手機廠商增速表現更好?!?/span>
盡管蘋果與OpenAI合作的傳言不斷,但接入GPT-4o的ChatGPT展現出的這種令人驚嘆的實時交互效果以及暴增的流量,或許是讓蘋果最終選擇OpenAI作為合作伙伴的原因。
蘋果在“深思熟慮”之后,終于要邁出AI模型落地的第一步。
2.大招背后的問題
盡管距離WWDC24還有十多天,但是外界已經心急如焚。不少人好奇,蘋果和OpenAI的合作模式會是怎樣的?
WWDC24宣傳海報,圖片來源:蘋果
今年WWDC24的中文海報主題是“大招碼上來”,但是在蘋果放大招之前,一些問題不容忽視。
尤其是模型在端側和云側的使用情況以及用戶隱私的保護,是大家關注的焦點。
對此,Jim Fan在X上發帖進行了預測:
放棄siri。OpenAI為iOS提煉出更小型、純設備上的GPT-4o,并可選擇付費升級以使用云;
將攝像頭或屏幕傳輸到模型的原生功能,芯片級支持神經音頻/視頻編解碼器;
與iOS系統級操作API和智能家居API集成。
Jim Fan認為,可以通過OpenAI為蘋果設備訓練端側小模型,對部分付費用戶提供云側大模型的方式進行合作,進而靈活地解決用戶隱私保護的問題。
無獨有偶,古爾曼此前也發文稱,蘋果公司計劃將自研高端芯片(如M系列芯片)置入云計算服務器中,用于處理計算難度大的AI功能,而相對簡單的AI功能則直接在iPhone、iPad和Mac等終端設備進行本地處理。
不過,蘋果想要在自己的設備上用好OpenAI最先進的大模型,還有以下三方面的問題值得探討。
首先是Siri用什么模型的問題。由于Siri是人機語音交互的入口,很多人好奇,蘋果是會將Siri接入云端的GPT-4o模型,還是會將本地與云端模型混合使用,為Siri提供服務?
與國內手機廠商普遍采用云端處理語音助手的請求不同,Siri的喚醒和識別都是在本地進行的。但是,端側模型對手機內存、CPU、GPU算力調度的要求更高,vivo副總裁、OS產品副總裁周圍就曾直言:“性能方面,如果做輸入法的出詞推薦,兩秒才能出一個詞;功耗方面,大參數量級的大模型在端側運行非常耗電?!?/span>
國內某手機廠商專家西風(化名)在一場專家調研會上表示,由于GPT-4o參數量巨大且依賴強算力,因此Siri在接入GPT-4o后,不會走現有的端側識別合作路線,而是會在云端調用識別功能。
他推測,蘋果喚醒可能直接使用GPT-4o的云端模型,但具體任務的調用策略需要一個系統引擎來決定何時調用云端或本地模型。對于文本處理、生成等功能,本地模型就能勝任;但對于需要細膩度和準確率更高的多模態交互(如視頻功能),就需要調用云端模型來解決。
西風的推測,與古爾曼的最新爆料基本一致。古爾曼透露,蘋果的iOS 18和macOS 15都將包含特定的軟件,用于確定任務是在端側還是云側進行處理。
接近蘋果的硅谷某大廠生成式AI開發者麗聲(化名)則表示,由于蘋果對用戶隱私的極端重視,蘋果跟OpenAI在大模型上的合作“只可能在云上進行”,不會讓OpenAI為其定制端側模型。“OpenAI對iPhone內應用的調用權限,也需要視用戶信息的隱私程度而定?!丙惵晫Α讣鬃庸饽辍拐f。
其次是雙方合作后,具體產品形態和落地時間的問題。蘋果會不會單獨為OpenAI定制一個硬件?具體的落地時間會在何時?
Tayside Investments Australia的資深分析師趙冬帥認為,蘋果可能會先從PC入手,先推出搭載了GPT-4o大模型的Macbook,以應對微軟剛剛推出的“Copilot+PC”的挑戰;同時他認為蘋果會專門給GPT-4o定制一個硬件產品,以突出GPT-4o的語音和視覺交互功能。
而在西風看來,GPT-4o仍將會搭載在iPhone手機上,只是出現時間早晚的問題。他認為,GPT-4o的云端應用預計會在iOS 18發布時出現,而與硬件的充分融合則會在今年9月份的iPhone 17上體現,這也將帶動國內廠商瞄準AI手機定義進行相應變革和參照。
麗聲對于“蘋果可能推出新硬件”的猜測持否定意見。在她看來,蘋果的硬件戰略是非常固定的,絕對不會因為和OpenAI合作就為其專門定制新的硬件?!疤O果大概每六到七年才會出一個新的硬件產品,GPT-5可能明年年初就會發布,那如果按照這個邏輯,難道GPT每迭代一個版本,蘋果就要為其定制一款硬件嗎?”麗聲說。
最后是接入OpenAI后用戶高頻使用帶來的算力調度與算力成本問題。接入GPT-4o后,iPhone全球超過10億的活躍用戶會不會使蘋果的云端交互變得不順暢?蘋果又該怎么解決接入GPT-4o后算力成本大幅提升的問題?
「甲子光年」了解到,一般來說,一個手機廠商每年需要向識別相關的大模型供應商付費大約8000萬元左右。如果蘋果接入GPT-4o,預計支付的費用會在億元級別。
GPT-4o當前的定價,圖片來源:OpenAI開發者平臺
或許也正是因為未來搭載大模型的iPhone太耗費算力、太貴了,蘋果在嘗試一種更加便宜高效的云端算力提供方法:直接將它的PC端芯片M2 Ultra放進云端服務器。
這也意味著,為了更好地參與生成式AI的競賽,蘋果似乎瞄上了算力端,打算自己上手做云服務了。
麗聲對「甲子光年」證實了這一點。她表示,之前蘋果做AI相關業務的時候,算力端只是通過買顯卡、買AWS云服務解決,但是作為一家軟硬結合的大廠,蘋果在人力、財力上都不缺,很多蘋果內部員工也都傾向于自己做云服務。因此她認為,蘋果未來可能不會把大模型訓練和推理所用的算力像以前一樣交給AWS解決,而是自己下場做云。
除了云側算力,端側算力同樣重要。目前主流端側模型的參數量均在百億左右,算力需要滿足實時執行這樣的模型的要求,便需要擴大芯片面積來提升性能。
「甲子光年」注意到,蘋果在其最新發布的iPad Pro上搭載了M4芯片,這是目前蘋果性能最強的芯片。M4芯片的NPU運算速度達到了每秒38萬億次(38 TOPS),而蘋果的上一代芯片M3的NPU運算速度只有每秒18萬億次(18 TOPS)。
M4芯片,圖片來源:蘋果
怎么理解這一數據?以自動駕駛需要的算力類比,如果要實現L2級自動駕駛,可能需要20 TOPS;L3級自動駕駛需要50—100 TOPS;L4級自動駕駛需要約2000 TOPS。也就是說,現在M4芯片相當于L2.5級自動駕駛需要的算力水平。
與OpenAI的密切接觸,和對云側、端側算力的布局,都能看出蘋果All in AI的戰略野心。盡管雙方合作還未官宣,盡管蘋果在中國市場份額出現下降,盡管OpenAI大模型并無在華落地資質(有消息稱,蘋果公司正在和百度進行談判,以便在蘋果設備使用百度人工智能生成技術),但是蘋果和OpenAI將如何共同塑造下一代AI手機及其影響,是安卓手機廠商不得不思考的問題。
3.蘋果的后發優勢
當我們把蘋果入局AI放到全球手機和PC廠商的競爭生態中去考慮,就會發現有一個不得不回答的問題:蘋果將大模型引入終端設備,和其他已經落地大模型的廠商相比,后發優勢是什么?
iPhone與Macbook,圖片來源:蘋果
龐大的用戶基礎、完善的產品生態是蘋果很明顯的優勢。根據蘋果2024 財年第1財季(2023年第4季度)的財報,包括iPhone、iPad、Mac等,全球活躍的蘋果設備數量超過22億臺。而根據Asymco知名分析師霍勒斯·德迪烏(Horace Dediu)發布的數據,其中iPhone在2023年就擁有了超過10億的活躍用戶。
一方面,蘋果可以通過自有的用戶數據訓練大模型,增強自有模型的能力;另一方面,能力更強的大模型也能反哺產品,用更強的功能吸引更多的用戶,進而在產品生態中形成一個不斷增長的數據飛輪。
麗聲則認為,蘋果做大模型,最大的優勢是軟硬一體。
“很多國內廠商用的是高通的芯片,來回的溝通成本、上機時間成本很高,很影響產品的快速迭代,而蘋果的自研芯片則沒有這種問題;此外,軟硬一體的好處是蘋果不用拘泥于現有的大模型架構,可以在自己的芯片上做微調進而設計創新架構,而用高通芯片的國內廠商只能根據Llama這種現有的模型架構做?!丙惵暩嬖V「甲子光年」。
盡管OpenAI即將融入到蘋果的軟硬一體的范式中,成為蘋果后發優勢中的一環,但這并不是永遠不變的。
麗聲還透露,這次與OpenAI的合作只是蘋果在AI和大模型領域的一次“試水”,在更遠的未來,蘋果很有可能拋棄OpenAI,轉而完全采用自研的大模型。
“蘋果跟OpenAI的合作很可能不會一直延續下去,我認為這只是蘋果的一次短暫的試水,把一些AI功能按部就班地加入進來,看看大家的反饋,然后再做一個屬于自己的GenAI系統。畢竟要做一個頂級且安全的大模型,投入不會少,蘋果作為大公司肯定能掏得起這個錢,只是因為公司體量太大業務太多,不可能短時間內投入大量人力物力財力搞大模型。按照蘋果這幾年的產品和經營策略——既不支持開源也很少跟外界合作,因此這次很可能也只是先試試水?!丙惵曊f。
軟硬一體的范式,帶來了蘋果產品中那些令人贊嘆的交互功能。盡管在生成式AI時代,蘋果入局較晚,但依然值得期待,畢竟有些交互體驗和效果,只有蘋果才能做出來。
蘋果和OpenAI是否能夠成功合作,蘋果是否可以發揮后發優勢打破增長困境、引領技術創新,還有待觀察。
但對于所有的智能終端廠商來說,新的戰爭開始了。
(封面圖來源:Cybernews)