開欄語


當人工智能的浪潮席卷全球,北京正以科技創(chuàng)新之姿,成為AI大模型領(lǐng)域的戰(zhàn)略高地。從智源研究院的“悟道”大模型問世,到“天使投資人”模式孵化原創(chuàng)成果,再到月之暗面、智譜等人工智能獨角獸崛起,這座城市不僅匯聚了前沿技術(shù),更以開放生態(tài)孕育突破性成果。


如今,北京正積極打造“全球開源之都”,一大批研發(fā)機構(gòu)、企業(yè)積極擁抱開源,而開源也已深入到汽車、機器人等眾多行業(yè)。發(fā)展AI將是一場科技長征,在北京市科委、中關(guān)村管委會的支持下,新京報AI研究院推出“AI浪潮錄”系列專欄,深度訪談此次AI浪潮的親歷者與見證人,講述AI競爭新格局與背后的故事。


英諾天使基金合伙人王晟。受訪者供圖


創(chuàng)業(yè)者與科學家之外,投資人的深度參與,是一個行業(yè)實現(xiàn)真正繁榮發(fā)展不可或缺的關(guān)鍵要素。尤其在人工智能領(lǐng)域,天使投資人宛如初創(chuàng)公司的“啟明星”,為那些懷揣夢想的AI初創(chuàng)企業(yè)邁出至關(guān)重要的“第一步”,提供了無可替代的支持與助力。


2023年以來,AI大模型浪潮席卷全球。英諾基金作為一家較早關(guān)注AI的投資機構(gòu),在此之前就嗅到了生成式模型的潛力和商機。2022年6月,英諾基金投資了以清華NLP(自然語言處理)實驗室團隊為主體的大語言模型公司深言科技,彼時ChatGPT尚未出世。


在中關(guān)村夢想實驗室,英諾天使基金合伙人王晟回憶過往,腦海里是AI行業(yè)越過山丘,也有當下的大浪淘沙。他的投資經(jīng)歷中,曾目睹十余年前以CV(計算機視覺)和自動駕駛為主的第一波AI浪潮,如今眼見AI Agent(智能體)和具身智能崛起。王晟很少“海量”看項目,更偏向于主動挖掘創(chuàng)業(yè)者,在他看來,這一輪AI大模型浪潮的創(chuàng)業(yè)者具備鮮明的特點,“大多是科學家和‘技術(shù)大?!?,圈子比較收斂。一名優(yōu)秀天使投資人需要做到的就是,當他們想要創(chuàng)業(yè)時會找到你?!?/p>


王晟透露,目前投資的過半項目都在“水下”,“只有我們知道或只局限在小圈子里,并由我們鎖定投資,我們幾乎不會投資完全市場化、公開化的路演項目。”


他眼中,投資人更青睞有經(jīng)驗的初創(chuàng)公司創(chuàng)始人,學術(shù)和科研能力應(yīng)該是標配。而隨著ChatGPT和DeepSeek之后人們對大模型產(chǎn)生“超級共識”,AI初創(chuàng)公司不要試圖占領(lǐng)巨頭的地盤,因為它們需要有較為寬松的窗口期。


押寶·投資人青睞有經(jīng)驗的創(chuàng)始人


新京報AI研究院:在過去幾年AI大模型技術(shù)發(fā)展浪潮中,你作為投資人有哪些經(jīng)歷?


王晟:我們是最早關(guān)注這一波AI大模型浪潮的投資人,某種角度上來講,我們預判了這幾年的AI走向。2021年年底至2022年年初時,我們的投資方向非常明確,就是要投生成式模型。這是我們這些年逐漸理解和消化 AI范式的進化所產(chǎn)生的認知。因此,2022年6月,我們投資了大語言模型公司深言科技,深言科技的背后是清華大學NLP團隊,最初是一家典型對標OpenAI的公司。


英諾基金在2013年春天成立,當時正好趕上上一波以CV和自動駕駛為主導的AI浪潮,并投資了一些非常優(yōu)秀的公司,這加深了我們對AI的認知。同時,我們也觀察到,上一波AI浪潮是有邊界的,并非‘什么都能做’。2018年、2019年時,以“AI四小龍”為代表的產(chǎn)業(yè)走過了欲望的巔峰,走向了絕望的谷底。


也是在那時,我們注意到了新一波AI在NLP上取得的突破——BERT出現(xiàn)了。這是谷歌在2018年提出的一種預訓練語言模型。在此之前,使用AI處理語言是一個“老難題”,因為CV范式無法簡單平移到 NLP,而BERT則大幅度提升了NLP的能力,透過BERT能夠發(fā)現(xiàn),以Transformer為基礎(chǔ)架構(gòu)的模型提供了多元化能力,不光可以用于自然語言對話,還能用在其他智能任務(wù)上。


我們發(fā)現(xiàn)“這個東西挺好用”,由此開始跟學界、產(chǎn)業(yè)界了解這一技術(shù)創(chuàng)新,但尚未達到讓我們作出決策的閾值。2020年,隨著OpenAI發(fā)布GPT3,以及Diffusion文生圖模型等成果發(fā)布,我們發(fā)現(xiàn)這一輪AI并非單維,而是多維,顯示出了很大的爆發(fā)潛力, AI的新時代可能已經(jīng)到來。2021年底時,我們“極度關(guān)注”這一方向,因為它可能預示著一波AI新范式。在那時,國內(nèi)除了百度和阿里巴巴外,幾乎沒有幾家公司關(guān)注這一方向,市場上真正做對標OpenAI大模型的其實只有智源研究院。


而智源的科學家中,主要做大模型的團隊包括唐杰、孫茂松、文繼榮等。其中,孫茂松老師所在的NLP團隊所做的大模型范式基于GPT,恰好對標OpenAI。于是,我們在2021年年底找到了孫茂松老師,以及當時博士還未畢業(yè)的團隊成員豈凡超。


2022年春天,豈凡超準備著手創(chuàng)業(yè),我們立刻決定在他6月畢業(yè)之后就進行投資。也在此期間,豈凡超與許多家投資機構(gòu)進行了溝通,但很少有人知道GPT、Transformer、LLM(大語言模型)。


這一情況直到ChatGPT發(fā)布后才發(fā)生了逆轉(zhuǎn),ChatGPT讓產(chǎn)業(yè)界迅速產(chǎn)生了巨大共識,很多投資機構(gòu)立即下場,深言科技也得到了廣泛關(guān)注。之后大模型技術(shù)開始火爆,我們迎來了AI大模型浪潮。


新京報AI研究院:國內(nèi)一度開啟“百模大戰(zhàn)”,投資界如何在眾多AI公司中進行選擇?


王晟:投資人更青睞有經(jīng)驗的初創(chuàng)公司創(chuàng)始人。深言科技有技術(shù)實力,但公司團隊主要是以豈凡超為首的三位博士生,在融資上的競爭力不如曾經(jīng)有百億公司創(chuàng)業(yè)經(jīng)歷的王小川、萬億公司創(chuàng)業(yè)經(jīng)歷的王慧文。根據(jù)這一邏輯,也可以解釋為何楊植麟的月之暗面廣受青睞,因為他不僅有技術(shù)、有谷歌等國外公司的工作經(jīng)歷,同時也有創(chuàng)業(yè)經(jīng)歷,因此在投資者眼中很有競爭力。


“百模大戰(zhàn)”有一個前提,就是Llama的開源。在此之前,深言科技的團隊經(jīng)歷了三四年的研發(fā),訓練過三代大模型,但隨著Llama開源,許多大模型公司得以縮短這一段差距,創(chuàng)造一個新模型也不再是難事。


投資·海量看項目不如預判


新京報AI研究院:天使投資人如何進行投資,你如何找到AI領(lǐng)域的創(chuàng)業(yè)者?


王晟:目前,我們投資的過半項目都是“水下”的,即只有我們知道或只局限在小圈子里,并由我們鎖定投資,我們幾乎不會投資完全市場化、公開化的路演項目。


海量地看項目是一種效率極差的行為,一年即便看1000甚至2000個項目,也避不開噪聲的影響,最后項目轉(zhuǎn)化率可能只有1% 、2%,這是因為輸入不對。當輸入質(zhì)量變高,所投資項目的最終產(chǎn)出也會變成10%、 20%。


一個好的天使投資人,要做到AI和具身智能初創(chuàng)公司在考慮進行第一輪融資時主動來找你,因此在相關(guān)領(lǐng)域是否具有影響力,口碑和聲譽很重要。作為投資人,我們要關(guān)注到技術(shù)的發(fā)展方向,你的預判甚至可能早于科學界的證明。當我們想往一個方向投資時,會非常清楚在該領(lǐng)域中哪些學校做得好,哪些科學家做得好。


新京報AI研究院:目前在AI大模型領(lǐng)域創(chuàng)業(yè),需要具備什么樣的素質(zhì)?


王晟:首先基本保障是他的學術(shù)能力、科研能力。不論AI大模型還是具身智能,對技術(shù)能力的要求都很高。這跟投應(yīng)用產(chǎn)品不一樣,存在高技術(shù)壁壘。這些人都是學界或者行業(yè)中的翹楚,大家認可其學術(shù)水平。其次,每所高校都有自己的技術(shù)基因,一些高校初創(chuàng)公司產(chǎn)品的核心技術(shù)并非一代人的努力,而是這個學校、這個專業(yè)、這個實驗室?guī)状说呐?。幾十年的積累,最終這種能力賦予了轉(zhuǎn)化出來的那名創(chuàng)業(yè)者,這背后可能是幾十個老師、幾百個師兄師姐共同創(chuàng)造的價值。


此外,他是否有動機進行創(chuàng)業(yè),不同學校的文化基因不同。中國高校里創(chuàng)業(yè)最踴躍的是清華和浙大,雖然哈工大在AI和機器人領(lǐng)域技術(shù)實力也非常強,但由于學校文化的影響,創(chuàng)業(yè)者相對而言并不多。一家學校是否有創(chuàng)業(yè)風氣,往往要看這所學校過去是否出現(xiàn)過成功的創(chuàng)業(yè)者,他們以身入道贏得了尊重,很多師弟師妹就開始效仿,從而形成了一種文化。


新京報AI研究院:基于投資人的視角,當前大模型浪潮中AI公司創(chuàng)業(yè)者們有何特點?


王晟:當前AI大模型還沒有完全進入應(yīng)用時代,創(chuàng)業(yè)者圈子比較收斂。當應(yīng)用火熱之時,創(chuàng)業(yè)者是從人堆之中“涌現(xiàn)”出來的,例如王興、張一鳴,技術(shù)背景相對并不強。


這一輪AI大模型創(chuàng)業(yè)風潮,創(chuàng)業(yè)者大多是科學家或者“技術(shù)大牛”,圈子是收斂的,相對較窄,甚至某種意義上可以認為他們是一個科學共同體,找到這些科學家也比較容易。


AI大模型創(chuàng)業(yè)的前提是在學術(shù)研發(fā)上有深度。當然,隨著國內(nèi)技術(shù)進步、科研人員發(fā)布論文增多,很多東西已經(jīng)變得沒有那么“高深莫測”,門檻逐漸降低。但企業(yè)的工程實踐仍然需要很多資金、算力、數(shù)據(jù),真正花過錢、踩過坑的創(chuàng)業(yè)者并不多。


目前一個新趨勢是,產(chǎn)業(yè)在推動當前這一波AI技術(shù)范式上的作用逐漸增強。從論文的數(shù)量、質(zhì)量、高被引的次數(shù)上看,產(chǎn)業(yè)勝過了學界,這在過去從來沒有出現(xiàn)過,其中主要原因之一是學校的錢不夠,沒有辦法支持高技術(shù)壁壘,花錢煉大模型。


生變·“用錢換能力”已走不通


新京報AI研究院:當前投資AI的基金有哪些類型?


王晟:這個市場上主要有兩類基金:一類基金堅持長期主義,關(guān)注公司能做多大力度的創(chuàng)新,多大程度提升生產(chǎn)力。另一類基金關(guān)注公司到底有多少收入,賣出去多少產(chǎn)品。兩類基金風格迥異,前者能接受企業(yè)長期虧損,但企業(yè)一旦成功就會獲取大額收益。目前,最優(yōu)秀的互聯(lián)網(wǎng)公司都由長期主義基金投資,和后者沒有任何關(guān)系。雖然由于國內(nèi)資本市場等現(xiàn)實原因,許多基金屬于后者,周期較短,但天使基金的風格必然更偏向長期主義,因為我們投資的時候,對方并沒有產(chǎn)品,可能只有一個人、只有一個想法。


因此,我們會天然看對方是否有宏大的敘事,能否解決最終的問題,比如達到AGI(通用人工智能)。但我們也要面對現(xiàn)實,即在這種偏好的情況下,投資回報率產(chǎn)生風險怎么辦?對此解決方案有二:作為早期基金投資最早、估值最低的一輪,在企業(yè)快速發(fā)展的過程中,有很多退出機會,不局限于它最后能夠上市;我們不會只投某一領(lǐng)域的單點項目,而是體系化布局,例如機器人領(lǐng)域,我們既投資了機器人公司,也投資了供應(yīng)鏈公司,還投了場景化公司,圍繞整個產(chǎn)業(yè)鏈上下游進行布局。我們既關(guān)注劍指AGI的公司,也關(guān)注能有效落地的公司,以此讓投資組合更均衡。


新京報AI研究院:今年以來,DeepSeek和Manus的出現(xiàn)給你們的投資策略帶來了什么影響?


王晟:雖然我們很關(guān)注,但DeepSeek對我們的投資策略毫無影響,它驗證和增強了我們對既定投資策略的信心。今年,我們的投資重點是Agent(智能體),沒有推理就沒有Agent,DeepSeek恰好證明了推理模型的前景。


而對于Manus,我認為其本質(zhì)是集成了眾多的prompt(提示詞)。目前,一部分創(chuàng)業(yè)者和投資人的共識是prompt很難產(chǎn)生基座模型之外的能力,prompt本身沒有壁壘,其壁壘有可能是抓住了很強的用戶需求。相比之下,擁有更強技術(shù)能力,能夠把垂類行業(yè)中的推理決策訓練到模型里面的團隊會更受青睞。


當大模型擁有泛化能力的時候,留給初創(chuàng)公司的機會就不多,因為只要擁有足夠的知識,一家AI巨頭將可以涉足一切領(lǐng)域。但當我們進入垂類產(chǎn)業(yè)時,推理模型所依賴的是該產(chǎn)業(yè)中的各種決策經(jīng)驗,這些經(jīng)驗并不容易取得,無法泛化,這就給初創(chuàng)公司留出了發(fā)展空間。


新京報AI研究院:DeepSeek的成功對其他AI行業(yè)公司有何啟示?


王晟:DeepSeek的成功本質(zhì)是大語言模型的scaling law(規(guī)模效應(yīng))到頭,當天花板高、斜率很高的時候,中國公司可能難以追趕。舉一個簡單的例子,如果說過去投入10億美元就能將模型能力提升一倍,現(xiàn)在投10億美元可能模型能力連5%都提升不了,這就給了DeepSeek機會,讓它可以用大量相對較差的GPU訓練出一個能力接近OpenAI的頂級模型。


這就意味著,未來大模型訓練對GPU的需求量會逐漸降低,開始從“暴力美學”轉(zhuǎn)向更細致的工程化,過去“用錢換能力”的路走不通了。未來,或許只有多模態(tài)大模型仍然需要巨量算力。


我認為,AI初創(chuàng)公司不要試圖占領(lǐng)巨頭的地盤,因為它們需要有較為寬松的窗口期。我們目前不再下注大語言模型公司,一個很重要的原因是ChatGPT發(fā)布之后,所有人瞬間形成了巨大的共識,沒有人懷疑大模型,這就導致巨頭也一定不會放棄大模型的發(fā)展方向。在這種情況下,初創(chuàng)公司融資得到的資金處境就相對尷尬,因為它們在資金實力上無法和大公司相比。


在這種情況下,需要提醒大家的是:DeepSeek其實是一個以創(chuàng)業(yè)公司的組織架構(gòu)重新構(gòu)建的大廠,所以它既有創(chuàng)業(yè)公司的活力,又有巨頭的優(yōu)勢,才可以心無旁騖地追求AGI,而不用關(guān)心數(shù)據(jù)。相比之下,月之暗面等初創(chuàng)公司雖然也追求AGI,但也不得不通過投放提高數(shù)據(jù),因為沒有用戶就沒有下一階段的融資。


我對AI初創(chuàng)企業(yè)發(fā)展的看法就是,不要在一個超級共識形成起來之后,試圖去做沒有窗口期的事情。


新京報貝殼財經(jīng)記者 羅亦丹 編輯 王進雨 校對 柳寶慶