爭做AI淘金時代的賣鏟人。
作者|趙健
英偉達CEO黃仁勛正在試圖給行業建立一種印象——AI等于英偉達。
在AI大語言模型爆發的今天,要想完成對算力要求極高的AI訓練,英偉達針對人工智能的GPU芯片幾乎是唯一的選擇。
這種供需的極度不平衡讓英偉達的GPU一芯難求,就連OpenAI CEO山姆·奧爾特曼也在抱怨芯片短缺已經影響到了ChatGPT的發展。
黃仁勛對此一定喜聞樂見。2023年,在AI需求的推動下,英偉達的市值沖破萬億美元。
不過,有人正在試圖打破英偉達在人工智能領域“獨孤求敗”的狀態。
本周三,AMD(超威半導體)在其首次“人工智能與數據中心”產品發布會上,正式發布了年度旗艦芯片Instinct MI300,一款可以對標英偉達Grace Hopper系列的超級芯片。
Instinct MI300有兩個版本:MI300X僅有GPU,專為AI模型訓練設計,封裝了1530億顆晶體管;MI300A則是集多個CPU、GPU和高寬帶內存于一身的APU(AMD在2011年時提出的產品概念),封裝了1460億顆晶體管。
Instinct MI300的發布意味著,英偉達不再是AI公司對算力的唯一選項。AMD確實也成功吸引到了一些AI明星獨角獸,比如Hugging Face,AMD將為其CPU、GPU和其他AI硬件優化模型。
Instinct MI300承載著AMD在人工智能領域的野心。AMD CEO蘇姿豐近期曾表示:“如果放眼五年,你會在 AMD 的每一款產品中看到人工智能,它將成為最大的增長動力?!?/span>
AMD是英偉達的老對手,兩者在GPU市場的競爭已經持續了17年,大部分時間都以英偉達的勝利而告終。
而這一次,已經在CPU市場證明過一次的AMD,能否把成功經驗復制到GPU市場?
1.AMD想要英偉達的AI皇冠
AMD是全球知名的老牌半導體公司,成立于1969年。在今年Gartner發布的全球半導體公司的排名數據來看,AMD位列第七。
CPU是AMD的發家業務。1981年AMD獲得了英特爾X86系列處理器的授權,在PC時代的紅利期一舉做到了行業第二,而這個行業老二,一做就做了幾十年。
在CPU之外,AMD又通過不停地并購,逐步建立起“CPU+GPU+DPU+FPGA”完整的芯片布局。
其中比較重要的并購事件包括:
2006年7月,AMD斥資54億美元收購當時的GPU行業老二ATI,正式與英偉達展開GPU的競爭;
2022年2月,AMD斥資498億美元完成對FPGA廠商賽靈思的收購,加強在數據中心業務的布局;
2022年4月,AMD宣布以19億美元收購DPU芯片廠商Pensando,繼續擴大數據中心業務。
AMD的業務構成分為四大板塊:數據中心、客戶端、游戲與嵌入式業務。
數據中心包含AMD所有的服務器相關的收入;客戶端收入主要涉及臺式機與個人電腦,曾經是AMD最核心的業務之一,現在收入占比已經不高;游戲業務主要涉及GPU產品線,索尼、微軟是穩定的大客戶;嵌入式業務則主要來源于原賽靈思的業務。
隨著人工智能成為一種趨勢,數據中心成為各大云巨頭高度重視、大力投入的業務,也是英偉達、英特爾與AMD的兵家必爭之地。
在此前的2023年Q1財報會上,AMD強調AI為目前公司的第一戰略重點,AMD正致力于構建更加多元的AI產品矩陣。
而昨天AMD的產品發布會,就是首次以“人工智能與數據中心”為主題。蘇姿豐在發布會上強調,在大型語言模型的推動下,人工智能的市場機會越來越大,到2027年市場潛力可能從目前的300億美元增加到約1500億美元。
AMD不想錯過這場AI盛宴,但英偉達是橫亙在眼前的不得不翻越的大山。
在最新一季的財報中,AMD的數據中心業務營收12.95億美元,同比上一季度的12.93億美元,基本沒有增長。反觀英偉達,今年第一季度的數據中心業務營收創歷史新高,同比增長14%至42.8億美元,是AMD的三倍多。
而根據量化對沖基金Khaveen Investments測算,英偉達數據中心GPU在2022年的市占率高達88%,AMD和英特爾瓜分剩下的部分。
雖然AMD是GPU市場的老玩家,但其過去的GPU系列產品主要應用于圖像處理及AI推理領域,而對于并行計算要求更高的AI訓練卻入場較晚。
而Instinct MI300的發布,意味著AMD試圖在AI訓練市場,改變英偉達一家獨大的局面。
2.進軍AI訓練
Instinct MI300是第一款面向數據中心的高性能“APU”——一個由AMD獨創的概念。
2011年(AMD收購ATI的第五年),AMD在產品構想中以CPU和GPU分別類比人類左右腦,并基于此提出了“CPU+GPU”的異構產品策略,并將其命名為APU。
類比人腦,AMD認為左腦更像CPU,負責對信息的邏輯處理,如串行運算、數字和算術、分析思維、 理解、分類、整理等,而右腦更像GPU,負責并行計算、多模態、創造性思維和想象等。
圖片來自華泰研究
不過,2011年的AMD正處在“失去的十年”低谷期,無論是在CPU線還是GPU線,都沒能拿出足夠優秀的產品,APU的發展不盡如人意。
時間來到2020年3月,AMD發布了新的微架構版本CDNA,專門針對數據中心的高性能計算、AI計算而設計。在此之前,AMD的GPU是用同一套架構同時解決游戲與計算場景需求,自然不利于不同場景的優化。
Instinct系列產品,就是專為HPC高性能計算、AI計算而生的。而最新發布的MI300,在規格及性能方面都全面追擊英偉達的Grace Hopper。
Instinct MI300采用了臺積電5nm工藝,有兩個不同的版本:MI300X僅有GPU,專為AI模型訓練設計,封裝了1530億顆晶體管;MI300A則是集多個CPU、GPU和高寬帶內存于一身的APU,封裝了1460億顆晶體管。
AMD聲稱Instinct MI300比上一代產品MI250的AI性能高8倍,它可以將ChatGPT和DALL-E等超大型AI模型的訓練時間從幾個月減少到幾周,從而節省數百萬美元的電費。
AMD在發布會現場演示了MI300x運行400億參數的Falcon模型,讓它寫了一首關于舊金山的詩。蘇姿豐表示:“模型對容量的要求越來越大,你實際上需要多個GPU來運行最新的大型語言模型?!彼赋?,隨著AMD芯片上內存的增加,開發人員將不需要那么多GPU。
AMD尚未公布MI300定價,但管理層在FY23Q1財報電話會中表示數據中心產品將延續往日的高性價比定價風格,重點先把市場打開。
AMD預計MI300將于今年底前推出,并將搭載于勞倫斯利弗莫爾國家實驗室的百億級超級計算機EI Capitan及其他大型云端客戶AI模型中。
大摩分析師Joseph Moore給出樂觀指引稱,AMD已看到來自客戶的“穩定訂單”,公司2024年的AI相關營收有望達到4億美元,最高甚至可能達到12億美元——這一預期是此前的12倍之多。
不過,盡管AMD幾乎是唯一一個有能力對英偉達帶來挑戰的公司,但這必然是一個非常艱難的過程。
3.英偉達的護城河
在AMD的產品發布會之后,資本市場對此反響平平,AMD的股價下跌了3%以上,反而是英偉達的股價又上漲了3.9%,市值再次超過一萬億美元。
在投資人眼里,AMD的年度芯片MI300似乎仍然難以撼動英偉達的根基。
比如,AMD沒有在發布會上透露它的年度芯片獲得了哪些大客戶的支持。TIRIAS Research首席分析師凱文·克雷韋爾(Kevin Krewell)表示:“我認為,沒有(大客戶)表示將使用MI300X或MI300A,這可能會讓華爾街感到失望。他們希望AMD宣布已經在某些設計方面取代了英偉達?!?/span>
目前透露的客戶僅有開源大模型獨角獸Hugging Face,以及更早之前透露的勞倫斯利弗莫爾國家實驗室。但兩者與對數據中心芯片有更大需求的云巨頭而言不在一個數量級。
從芯片本身的性能而言,雖然MI300在一些參數上超過了英偉達,比如晶體管數量要高于A100的540億個,但是英偉達可能很快就會通過產品的迭代來彌補。
實際上英偉達已經在這么做了。5月29日,在AMD發布會之前兩周,英偉達在COMPUTEX 2023展前發布會上,正式發布了全新的GH200 Grace Hopper超級芯片,擁有2000億個晶體管,比MI300還要高。
更重要的是,英偉達同時宣布了谷歌、微軟和Meta將是首批采用這一超級芯片的大客戶。
除了產品本身過硬之外,英偉達另一個銅墻鐵壁一般的護城河,就是它的CUDA生態。
英偉達于2007年發布CUDA生態系統。通過使用CUDA,開發者可以將英偉達的GPU用于通用的計算處理,而非僅限于圖形處理。
CUDA提供了一個直觀的編程接口,它允許開發者使用C,C++,Python,以及其他一些語言來編寫并行代碼。
AI大神吳恩達曾對此評價:“CUDA出現之前,全球能用GPU編程的可能不超過100人,有了CUDA之后使用GPU就變成了一件非常輕松的事情?!?/span>
AMD在2016年推出了ROCm,目標是去建立可替代CUDA的生態。2023年,CUDA的開發者已達400萬,包括Adobe等大型企業客戶。用戶越多,粘性越好,起步就晚的ROCm要想構建開發者生態還需要時間。
Moor Insights & Strategy分析師Anshel Sag表示:“盡管AMD在硬件性能方面具有競爭力,但人們仍然不相信AMD的軟件解決方案能與英偉達競爭?!?/span>
這是屬于英偉達的獨一無二的護城河。AMD要想打破,極具挑戰。
4.AMD的成功,可能難以復制
對于AMD來說,或許最不怕的就是面對挑戰。
從2006年到2016年,這是AMD“失去的十年”。這一時期,AMD的兩個最大的競爭對手英特爾和英偉達,正在摩爾定律的驅使下進行產品迭代。
英特爾踐行著“Tick-Tock鐘擺策略”,每兩年做一次大的產品迭代更新(一年工藝制程、一年微架構設計);英偉達則在黃仁勛提出的“黃氏定律”——顯卡每6個月性能提升一倍——的指引下,每半年將產品升級一次。
AMD沒能跟上兩個行業老大的產品更新節奏,公司發展一度瀕臨崩潰,直到2014年蘇姿豐作為AMD第五任CEO接手。
蘇姿豐剛接手的AMD是一個爛攤子,它的筆記本電腦市場被英特爾占據,新興的智能手機市場被英偉達、高通和三星瓜分,服務器市場份額也從原來的1/4縮水至僅2%。AMD不得不解雇了大約四分之一的員工,股價徘徊在2美元左右,分析師直稱“已無法投資”。
當時英特爾CEO柯再奇如此評價AMD:“這家公司永遠不會再回來了,所以不要再介意把重點放在新的競爭對手高通身上了?!?/span>
但后來的故事大家都知道了。在蘇姿豐的帶領下,AMD在CPU市場打了一場漂亮的翻身仗,不僅一步步蠶食了英特爾的市場份額,股價也在2022年2月歷史性地反超了英特爾。
AMD之所以能夠在CPU市場突圍,很重要的原因在于抓住了對手英特爾的戰略失誤。
在芯片制造這一環節,AMD與英特爾選擇了不同的路線。AMD在2009年剝離了旗下的芯片制造業務,合資成立了獨立的晶圓代工廠格芯,而自身只專注于芯片設計(Fabless),這讓AMD可以選擇獨立的第三方晶圓代工廠(Foundry)。英特爾則從成立以來一直是集芯片設計與芯片制造于一身(IDM)。
在半導體產業發展的早期,像英特爾這樣高度垂直整合的IDM才是更主流的模式。AMD聯合創始人Jerry Sanders還說過一句名言:“有晶圓廠才是真男人(Real men have fabs)?!辈贿^諷刺的是,AMD正是因為后來剝離了晶圓廠才有機會完成逆襲。
2014年之后,英特爾的芯片制程遭遇技術困難,10nm芯片(相當于臺積電7nm)良率不佳,導致原定于2016年下半年的10nm量產多次推遲,最終到2019年下半年才發布。此前英特爾一直堅持的Tick-Tock策略也因制程技術原因而放棄。
英特爾創始人戈登摩爾提出了摩爾定律,但英特爾現在卻遭遇了“摩爾定律的詛咒”。這讓AMD抓住了反超的機會。
2018年,AMD先是與格芯合作,推出12nm制程的Zen+架構,首度在制程上超越了14nm的英特爾。隨后在2019年,AMD與臺積電合作,推出了7nm制程(相當于英特爾10nm)的Zen 2架構,領先英特爾。自此之后,英特爾一直在制程上落后AMD一拍,直到現在仍然沒有改善。
今天,類似的“老二挑戰老大”的劇本似乎在重新上演,只是戰場從CPU換成了GPU。雖然AMD還是“蘇媽”帶領的AMD,但黃仁勛帶領的英偉達,卻比當年的英特爾風頭更盛。
在硅谷,黃仁勛被稱為好斗的男人,愛穿黑色皮衣,時刻做好反擊的準備,股價漲到100美元時還把英偉達logo文到胳膊上。
2016年黃仁勛還不把AMD放在眼里,他直接評價說英偉達跟AMD是“9跟0”的差距。2019年初AMD搶在英偉達之前首發7nm顯卡,黃仁勛表面上似乎也毫不在意,直稱“這顯卡很一般”。
而今天,AMD再一次用更好的產品向英偉達發起挑戰。一邊是躊躇滿志的AMD,一邊是獨孤求敗的英偉達,一場關于人工智能的GPU大戰,現在才剛剛開始。