聚焦。
作者|甲小姐 劉楊楠
我與Demi(郭文景)認識小十年,深度接觸有三次:第一次在北京主持開復老師的會議,她是創新工場實習生;第二次在波士頓主持哈佛中國論壇,她是主辦者和邀請人;第三次在硅谷參與GTC,她是Pika創始人。
今年3月見到她時,B輪融資還在進行中。Demi的時間線一直很快,這在她創業一年經歷中可見一斑:
2023年11月底,Pika 1.0帶著一段馬斯克穿著太空服飛上天的視頻demo大火出圈,那時團隊僅有四人,公司成立不到半年時間就完成3輪融資,共計5500萬美元,估值升至2.5億美元;
2024年2月,Sora將AI視頻推向今年AI第一個輿論高點,這讓Demi很興奮,她對我說“之前我們和Runway競爭,現在是和OpenAI競爭,不是更加exciting?”;
2024年6月5日,Pika宣布已完成總額8000萬美元的B輪融資,本輪由Spark Capital領投,Greycroft、Lightspeed Venture Partners以及Jared Leto參投,公司估值超過4.7億美元,比上一輪翻了一倍。
最初,國內流量偏愛的是Demi的背景,“95后”“Pika Lab創始人”“A股上市公司實控人之女”“女兒概念股”“哈佛天才少女”。
“我當然不是很喜歡被這樣關注,但這些不會影響到我的正常生活。對我來講,把事情做成最重要?!盌emi告訴我,“如果今天我做的是一家研究機構,我會非常固執地選擇一個研究方向;但我做的是一家公司,我們一定是很開放的,什么能達到下一個milestone,我就做什么?!?/span>
Demi告訴我,某種程度上,她對視頻的熱愛遠大于AI本身。她想做的,就是用AI顛覆整個視頻行業,打造一家偉大的公司。
今年3月,在硅谷Pika的辦公室里,和Demi聊了聊這背后更多的故事。
1.近況:“我們每天都在跟OpenAI和Elon Musk搶人”
甲小姐:你們的融資過程順利嗎?
郭文景:還挺順利的,我們和投資談融資都不是非常正式的場合,可能會隨便喝杯咖啡。
甲小姐:你喜歡什么樣的投資人?
郭文景:三觀、認知比較match的。
甲小姐:你們的投資人都是美國人,中國人的標簽會讓他們對你有特殊看法嗎?
郭文景:沒感覺有。我們公司三個創始人是中國人,其他員工還是美國人居多。
甲小姐:沒想過搭建一個更多樣化的創始團隊?
郭文景:做成這件事最重要,沒想diversity(多樣性)。
甲小姐:如果有大公司想收購Pika,你會同意嗎?
郭文景:我們短期內不會考慮被收購。
甲小姐:Sora發布時你感受如何?
郭文景:整體還是超出預期。之前大家知道OpenAI在做這件事,但不知道他們做到了什么程度。Sora對AI視頻行業的影響肯定挺大的,我們很相信AI顛覆視頻行業這件事,但很多人之前都沒有真正believe in。
甲小姐:你如何對比Pika和Sora?
郭文景:Sora的效果確實比較好,但有一個致命的問題是它的推理特別貴,不能被真正使用。我們的模型可能效果差一點,但能被使用,會努力在一定時間內趕超Sora。
甲小姐:很多人認為Sora會讓AI視頻賽道重新洗牌,對創業公司形成降維打擊,你怎么看?
郭文景:所有事都有消極和積極的兩面,每次挑戰背后都是一次機遇。
Sora出現后,一方面會讓做技術的人看到AI生成視頻模型可以scale up,之前很多創業公司不敢大幅度砸機器,因為我們不確定scaling law在視頻領域是否可行。Diffusion是一個非常小的領域,真正有經驗的人挺少的,但我們作為為數不多的有經驗的創業公司,追趕Sora在技術上沒有那么難,Sora會給我們在技術上有一定指導。
另一方面,做產品的人會看到新的產品機會。我們做產品,Sora完全是模型,用戶都是兩撥人——AGI和AI視頻是完全不同的兩個賽道,本身就沒有直接競爭。
OpenAI如果真的要做AGI,它不會這么vertical on(垂直在)一個產品。再退一步,即使是LLM,除了Google、Meta還有Anthropic、Mistral,也不是只有一家,但現在視頻只有OpenAI一家。之前我們和Runway競爭,現在是和OpenAI競爭,不是更加exciting?
甲小姐:在AI視頻領域你們有一定先發優勢,Sora出現后,這個賽道會更擁擠嗎?先發優勢會被稀釋掉嗎?
郭文景:我覺得現在沒有很擁擠,至少在美國,這個市場很大,但沒有什么創業公司。
甲小姐:為什么會沒有什么創業公司?
郭文景:現在最有名的就是Runway、我們和Videogram,Midjourney現在只做圖片,其他還有很多很小的公司,不是特別大的competitor。
Sora出現后,對AI視頻領域的公司也進行了一波清理,有些公司可能會往前走一步,有些會往后退一步,但可能很難出現新的公司。對我們來說會更加有利,我們算是行業里稍微有點名氣的公司,反而變成一種優勢,會獲得更多資源,現在可能是個招人的好時期。
甲小姐:你們團隊現在有多少人?招人難嗎?
郭文景:去年底是4個人,現在15個左右。招人倒是不難,我們主要考慮招什么樣的人,我們希望團隊有更多新的資源進來,但不太希望團隊拓展得太快,如果招一個不好的人有時也挺麻煩。
甲小姐:如果你看中的一位技術大牛說他想加入OpenAI,你會怎么說服他?
郭文景:我們每天都在跟OpenAI和Elon Musk搶人。每個人在乎的東西不一樣,很多技術大牛往往都希望自己成為核心人物,而我們想做下一個Sora,甚至超過Sora,可以讓大佬充分發揮。
2.目標:“我不追求AGI,我們想做一家偉大的公司”
如果視頻模型能生成我們的對話,是不是意味著它理解了語言?
甲小姐:AI視頻已經成為一場明牌游戲,你創業時預想過這一切嗎?
郭文景:最開始肯定不會想這么多,只是很熱愛這件事。我們希望用AI顛覆整個視頻行業,這是我們的初心。
我們公司超過50%的人都是做產品的,超過1/3的人是做創意的。同時,我們也想做最強的視頻生成模型。我們認為產品和技術要融為一體,既需要模型來支撐產品,也需要產品來inspire模型,最終還是要把模型變成產品才有意義。
甲小姐:和AI視頻相比,你想過拓展邊界,去追求AGI嗎?
郭文景:不會,focus(聚焦)還是挺重要。雖然我們同時做產品和模型,但我們主要的資源都focus on視頻。
甲小姐:保持專注難嗎?
郭文景:不難,因為我們很熱愛這件事情。
甲小姐:感覺你對視頻的熱愛超過對AI本身?
郭文景:我真的想把“AI顛覆視頻行業”這件事做成。未來我們可能會在各個領域開放合作,比如做教育領域視頻相關的業務,但整體專注于視頻。
甲小姐:你會看其他人關于AGI的辯論嗎?比如OpenAI說Sora可能是通往世界模擬器的有效路徑,但Yann LeCun認為Sora不是世界模型。
郭文景:我認為世界模型只是一個概念,像AGI一樣,你不知道它到底是什么。而視頻模型是一個技術概念,視頻是一種模態。視頻模型也可能是世界模型。如果視頻模型越來越好,能生成1個小時甚至更長時間的視頻,就相當于它能預測、模擬世界。
甲小姐:王小川認為語言才是通往AGI的主軸,視頻是一場集體跑偏。你怎么看?
郭文景:視頻肯定是通往AGI很重要的一部分,甚至有可能跟語言一樣重要。視頻模型不斷發展肯定會有一些語音或Audio的成分,如果視頻模型能生成我們的對話,是不是意味著它理解了語言?
很多人都會對AGI有自己的理解,想象也更宏偉,但我認為沒必要這么早下結論。我們公司的創始團隊都很有ambition(野心),但我們的策略是一步一步走。每一步都很清晰,也更加achievel(可實現),最終抵達宏偉的目標。
甲小姐:你的野心是什么?
郭文景:我們想做一家偉大的公司,比如Apple。
3.技術:“達到60s不是難事”
不需要定義技術路線,而且我也不需要強調我們有多少technology thesis(技術論文)。AI要做consumer level interface(消費級借口), professional output(專業級輸出)。
甲小姐:現在Pika生成一個3秒的視頻成本是多少?
郭文景:不太能透露,但遠遠低于Sora。現在如果刨除GPU成本,我們公司整體收入是profitable(有盈利)的。當然,訓練大模型動不動就是幾千萬、上億美元的投入,如果加上模型訓練的成本就沒法算了。
甲小姐:你們的產品從1月開始付費,現在付費率有多高?
郭文景:這個不方便透露。
甲小姐:你們下一代模型什么時候出來?
郭文景:今年,會在1.0的基礎上有很大迭代。
甲小姐:AI視頻領域,技術路線會收斂到DiT(Diffusion with Transformer)上嗎?
郭文景:我們持比較開放的態度。如果今天我做的是一家研究機構,那我會非常固執地選擇一個研究方向;但我做的是一家公司,我們一定是很開放的,什么能達到下一個milestone(里程碑),我就做什么。
甲小姐:現在AI視頻領域有明確的技術路徑劃分嗎?
郭文景:可能有一些,我個人認為這是非常research的question,實際上現在這些視頻模型并沒有差非常大。
甲小姐:你不會定義Pika一定要走哪種技術路線?
郭文景:不需要定義,而且我也不需要強調我們有多少technology thesis(技術論文)。短期內肯定會有我們自己的technology thesis,但長期來看我們還是比較open。
甲小姐:你是scaling law的擁躉嗎?
郭文景:雖然我之前一直在做技術,也讀了PhD,但我并不會特別執著于這些research的方法。
甲小姐:Sora發布之后,你有哪些戰略調整?
郭文景:唯一做調整的是資源分配,原來更focus產品,research team可能還要需要做點產品,但我們現在愿意給research team更多資源,讓他們更加專注這件事情。
甲小姐:視頻的數據標注對藝術審美有很高要求,在數據標注這件事上,藝術家在指導工程師嗎?
郭文景:我們在非洲一些發展中國家有個人外包的數據標注團隊。我們有一個專門的團隊負責把關藝術審美。數據標注有很多種,不全跟藝術有關,藝術只是把關這個視頻好不好看,同時也會有一些合成數據。
甲小姐:Sora承認他們用了很多合成數據,同時OpenAI也正在經歷一系列版權紛爭,你們會遇到相似的問題嗎?
郭文景:這是所有公司都要面對的一個問題,我們一定非常serious(嚴肅),但現在還好,沒有遇到這些問題。
甲小姐:算力是挑戰嗎?
郭文景:我們幾乎認識所有美國運營商,很多都是創業前認識的,所以還是能拿到卡。卡的問題雖然不算容易,但還可以解決。
甲小姐:Sora發布后,你們的視頻可以加聲音了,這件事從技術上難嗎?你們內部如何決策產品的下一個功能做什么,不做什么?
郭文景:有一些技術難點。我們的大方向是面向creators(創作者)做出一個更加controllable(可控的)的video making creator(視頻創作器)。這個方向下,我們會設置長期feature(特征)和短期feature。
甲小姐:Sora團隊似乎很擅長做一些抓人眼球的demo。
郭文景:他們有一個專門做demo的團隊,里面有些藝術家。
甲小姐:Pika 1.0版本跟馬斯克坐火箭的demo創意是你想的嗎?
郭文景:是的。我招了一個做視頻的人,我們兩個人一起做。我們公司的確比較在乎審美,至少我個人對產品和市場還是挺感興趣,長期還是會focus on這件事。我認為marketing是種taste,有點像藝術品一樣,我們最初做demo video的時候沒太想過用戶需求,更多是先過我們自己這關。當然,也需要在我們的taste和用戶需求間做些平衡,其實很難說,這是一個玄學。
甲小姐:你們的視頻時長有最新突破嗎?
郭文景:內部有突破,達到60s不是難事。
甲小姐:你們未來會to C還是to B?
郭文景:我們希望更to C,但可能也會嘗試做API。尤其像我們這樣的工具,之前有professional consumer(專業消費者)的區別,但AI要做consumer level interface(消費級接口), professional output(專業級輸出),打通這件事情。
甲小姐:你們想代替Adobe After Effects(AE)嗎?
郭文景:肯定不是,我們想做更基于AI底層的東西。
4.壁壘:“自信不來自一定要打造一個多么牢固的護城河,我們會用行動說話”
如果有10萬個對視頻很狂熱的用戶愿意給我們每月付100美元,我們就有1億美元收入了。
甲小姐:你的目標是盡快盈利?
郭文景:我們要做產品,每天都想盈利,現在之所以要搞更大模型,是因為盈利唯一的壁壘是技術。
甲小姐:你堅信能盈利的原因是什么?
郭文景:通過C端盈利在國內是挺難,但美國可以做,當然后面也可能有變化,因為我現在發現很多人對API很感興趣,尤其是一些美國大公司。但我認為to C在美國還是有機會,Midjourney已經把訂閱價格抬得挺高,如果有10萬個對視頻很狂熱的用戶愿意給我們每月付100美元,我們就有1億美元收入了。但國內訂閱價格不可能這么高,而且國內太卷了,價格都壓得非常低。
甲小姐:你們的用戶增長有下降的趨勢嗎?
郭文景:后面下降了,但這個很難預測。
我認為AI時代給視頻行業帶來最大的不同是,之前公司完全拼產品和市場,但現在要拼技術。其實現在最大的瓶頸是技術,也就是輸入文字后模型的生成水平不夠好。只要技術能做好,產品和市場的問題都能通過不斷迭代去解決,我們長期還有其他plan(計劃)。
我相信“視頻制作”這個需求是存在的,這件事真的很難,是true problem(真正的問題)。把這個問題解決了,用戶甚至可以用我們的產品去做廣告,做什么都可以。
甲小姐:投資人會問你AI生成視頻的市場規模到底有多大嗎?
郭文景:肯定會問,我會畫一個愿景(笑)。
所謂AI native(AI原生)的視頻生產,包括視頻平臺和視頻制作,哪怕產品設計、用戶交互都需要AI技術支撐的,純產品公司可能做不了,因為你的技術無法實現產品設計,而純技術公司也很難做好產品。但我們不僅有模型,還有產品,哪怕沒有產品,只有最好的視頻生成模型,你都會成為一家非常valuable(有價值)的公司。
甲小姐:當視頻制作這個true problem解決后,AI native時代的Tiktok可能長什么樣?
郭文景:都有可能,擁抱不確定性。不管它怎么樣,“視頻制作”這一步都必須先做好。
甲小姐:你的護城河是什么?
郭文景:我們希望我們永遠是甲方——沒有任何護城河,但我們每天要非常adaptive(有適應能力),把握新的機會,更好地執行新的策略。很多時候自信并不來自于一定要打造一個多么牢固的護城河,把事情做成最重要,我們會用行動說話。
甲小姐:你認為AI視頻的終局,各家比拼的是什么?
郭文景:創業公司到最后比的都是執行力和心態吧,不知道,我隨便說說,我真的不算是一個有經驗的創業者。至少對我們來說,心態和策略層面的執行力很重要。因為創業期間任何情況都可能發生,我不可能預測未來,但可以做的是對一切變動都能快速響應,公司的競爭優勢可能會隨著時間變動。
甲小姐:現在和Pika剛發布時相比,你的工作狀態有什么區別?
郭文景:去年12月底基本所有事都是我自己干,現在我們已經有一個團隊,我主要跟別人寫RPC(遠程過程調用)。
甲小姐:你最enjoy哪一部分?
郭文景:不同階段需要做不同的事,最初幾個月不只做模型,還學習做engineering,甚至還學習怎么做community,我們在Discord上最早的100個用戶是我直接手動DM(私信)的,包括后來運營這些社交賬號、做marketing video、UI設計、PR等等。
我希望團隊能自己運轉起來,但我每階段都會focus on公司當下最重要的事。比如最近我想在人才、數據、資本各方面資源獲取上加把勁。
甲小姐:你現在social(社交)多嗎?
郭文景:創業以后心態會不一樣,不會為了social而social。我整個人都會圍繞公司,可能更多時候,我見一個人不只是崇拜這個人,可能更多是希望達成一些partnership(合作關系)。
甲小姐:如果沒法達成合作關系,Elon Musk也不見嗎?
郭文景 :我會考慮一下這個見面對公司會有什么影響。
甲小姐:你每天的作息是什么樣?
郭文景:正常12點左右睡,早上8點起。
甲小姐:聽起來你的工作強度不大?
郭文景:我們剛開始創業的時候強度很大,當時我就發現體力和心態很重要,很多創業者心態并沒有很好,我還是比較積極的,一定要保證規律的作息和生活方式,才能讓你內心非常平靜,你會更強大。
甲小姐:你對自己目前的生活狀態滿意嗎?
郭文景:我挺喜歡硅谷的,特別是我在南灣。創業之后我的生活非常簡單,每天工作結束就回家,我希望自己生活的key比較簡單,比較千篇一律。
甲小姐:這不太像是一個20多歲女生的生活狀態。
郭文景:可能工作太有意思了,創業已經很不千篇一律了(笑)。
甲小姐:前段時間媒體扒了很多關于你家庭背景的信息,你介意嗎?
郭文景:我們在國內真的零PR。我當然不是很喜歡被這樣關注,但這些也不會影響到我的正常生活。其實我高三的時候經歷過一次這樣的討論,所以不太會被影響。對我來講,把事情做成最重要。
甲小姐:你的父親是企業家,他會給你提些建議嗎?
郭文景:比較少。我父母不是很同意我創業,我自己創了、融完錢才跟他們講的。但我日常跟他們交流也是很緊密的,只是工作上我會更獨立。
甲小姐:創業可能意味著你今后會長期定居硅谷,他們會希望你回國嗎?
郭文景:父母總是很支持孩子的,創業肯定很難,但選擇了創業就選擇了這些難題。
甲小姐:之前有媒體報道你們創業初期看到技術飛速發展,所以急著創業,現在還和當初一樣急嗎?
郭文景:我們有些時候還是會比較急,但心態上一直都比較平靜。創業一定要保持平靜的心態,但是也要把握機會。