當(dāng)杰夫·辛頓在2024年獲得諾貝爾獎的時候,他或許會想起12年前的冬天,來找到他的那家叫百度的中國公司。因?yàn)槭前俣茸钤绨l(fā)現(xiàn)了他關(guān)于神經(jīng)網(wǎng)絡(luò)研究的價值,并極力邀請他加盟。
2012年12月初的一天,美國滑雪勝地太浩湖的一家賭場酒店里,杰夫·辛頓和他兩名學(xué)生迎來了四方的競拍者,他們分別來自百度、谷歌、微軟和DeepMind。
辛頓名下的這間叫DNN research公司,其實(shí)沒有任何實(shí)體業(yè)務(wù),它唯一的資產(chǎn),其實(shí)就是這三位學(xué)者腦中的學(xué)識。
可能是覺得中國太過于遙遠(yuǎn),當(dāng)時已經(jīng)年近七旬的辛頓,最后接受了谷歌的出價。
但在彼時的大洋彼岸,中國的信息產(chǎn)業(yè)的諸多企業(yè)中,幾乎沒有人知道發(fā)生過一件這樣的事情,更不知道有一家中國企業(yè)已經(jīng)開始對人工智能的探索。
客觀講,拍板參加這次競拍的百度創(chuàng)始人李彥宏,是一個有方向感的科技企業(yè)家。在過去十幾年里,他的很多關(guān)于AI發(fā)展方向的判斷,都對產(chǎn)業(yè)產(chǎn)生了價值。
但也有人不認(rèn)同他的一些判斷,于是,邊爭論邊發(fā)展,直至逐漸被驗(yàn)證,成為共識,成為這個行業(yè)的有趣現(xiàn)象。
那么,我們不禁要問,李彥宏的方向感,從何而來?
——導(dǎo)語
01
應(yīng)用來了?!
2024年的百度世界大會,李彥宏的主旨演講,從一個技術(shù)問題開始。
這個問題,叫“AI幻覺”,它特指在生成式人工智能時代,模型生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)或用戶需求不一致的現(xiàn)象。
你也可以簡單的理解為,大模型在一本正經(jīng)的胡說八道。
李彥宏用一個四層的天壇圖片舉例,告訴臺下的聽眾——真正的天壇只有三層,但模型往往會自動生成一幅四層的圖片而不自知。并且,這是所有的生成式模型都會遇到的問題。但在真實(shí)世界里,這類問題往往出現(xiàn)的更加隱蔽且詭異,從而給用戶更多的困擾和誤導(dǎo)。
![]()
李彥宏告訴觀眾,百度用RAG(檢索增強(qiáng))和Image based RAG(/基于檢索增強(qiáng)的文生圖)的技術(shù),改善了文字和圖像生成中的幻覺問題。
而之所以把這個技術(shù)細(xì)節(jié)放在這次重要的演講的開頭,和李彥宏接下來要作的一個判斷有關(guān)——他認(rèn)為,“AI幻覺”直接導(dǎo)致了“(生成式)多模態(tài)大模型其實(shí)還沒有什么成規(guī)模的應(yīng)用出來”。
故而,在他看來,消除幻覺既是大模型領(lǐng)域在過去24個月實(shí)現(xiàn)的最大進(jìn)展,也應(yīng)該是AI應(yīng)用出現(xiàn)爆發(fā)的起點(diǎn)。基礎(chǔ)模型的能力已經(jīng)就緒,行業(yè)將迎來一個物種大爆炸的應(yīng)用爆發(fā)期。”
如果仔細(xì)的研究李彥宏過去18-24個月的講話,會發(fā)現(xiàn)“應(yīng)用”是一個出現(xiàn)頻率極高的詞匯。
22個月前,也就是早在2023年3月,李彥宏就提醒行業(yè)“不要重復(fù)造輪子”,并表示應(yīng)用才是大模型真正的機(jī)遇。
11個月前,也就是2023年12月16日,李彥宏更直接的表示了自己的焦慮:““我多多少少有點(diǎn)著急”,他在與極客公園的對話中談到:“整個國內(nèi)的AI大模型行業(yè),現(xiàn)在其實(shí)卷偏了。實(shí)際上,眼下更應(yīng)該抓住的機(jī)遇,是大模型原生應(yīng)用”。
而到了今天,他把2024年的百度世界大會的主題詞定為“應(yīng)用來了”,簡單、直接、強(qiáng)硬。
![]()
在實(shí)際行動方面,他在百度內(nèi)部推動了“百度所有業(yè)務(wù),都要根據(jù)?成式 AI理念重構(gòu),重做?遍原來的產(chǎn)品”;而在外部,為了給自己心目中的“應(yīng)用潮”再加一把力,他還在會上展示了遴選出來的Top100智能體和Top100產(chǎn)業(yè)應(yīng)用。
在當(dāng)下,談大模型原生應(yīng)用的當(dāng)然遠(yuǎn)非僅李彥宏一個人,但如此執(zhí)著且狂熱的業(yè)者,也著實(shí)不多見。
在筆者看來,李彥宏急于推動大模型的應(yīng)用落地,并非因?yàn)榇竽P鸵呀?jīng)完美,而是他的底層認(rèn)知決定的。
早在21世紀(jì)的第一個十年,他就反復(fù)的釋放一個觀點(diǎn):中國由于是(網(wǎng)民人數(shù))的互聯(lián)網(wǎng)第一大國,就有機(jī)會先遇到問題,進(jìn)而有機(jī)會先去解決這些問題,從而在應(yīng)用創(chuàng)新上實(shí)現(xiàn)跨越。
而這已經(jīng)變成了現(xiàn)實(shí)。
在近年,他把這個觀點(diǎn)濃縮成一個詞匯:“反饋式創(chuàng)新”,在很多場合提及——只有真實(shí)世界的實(shí)際反饋才能持續(xù)驅(qū)動創(chuàng)新。
這也解釋了,為什么他始終認(rèn)為,在大模型通往完美的路上,急需百萬級的“應(yīng)用”作為導(dǎo)航儀,去探索大模型的能力、產(chǎn)品與市場的契合度(PMF)。
但是,真實(shí)世界這次會按照他的判斷而做出改變嗎?
02
方向感
當(dāng)ChatGPT橫空出世后,在中國出現(xiàn)了百模大戰(zhàn),數(shù)百家公司紛紛投入大模型這個賽道,資本的眼神都是火熱的。
在很多人為這種圖景叫好、上頭的時候,李彥宏唱了反調(diào),他認(rèn)為——百模大戰(zhàn)造成了社會資源的巨大浪費(fèi),尤其是算力的浪費(fèi),這種局面不可持續(xù)。
但極多人當(dāng)時并不認(rèn)同他的觀點(diǎn),他們的理由是:只有150個員工時的oepnAI就做出了ChatGPT,那我們?yōu)樯恫荒?搏一搏?
事實(shí)是,雖然openAI起了個大早,但現(xiàn)在各大巨頭的大模型都趕上來了。
這反映了一種現(xiàn)象——巨頭公司往往在行業(yè)出現(xiàn)突破式創(chuàng)新時會因?yàn)轶w量過大、反應(yīng)較慢而落后半步,如IBM、微軟、甲骨文都犯過這樣的錯誤,但一旦龐大的資源和組織被真正動員起來,很容易趕上并碾壓初創(chuàng)公司。
這也幾乎注定了,大模型不是一條對初創(chuàng)公司友好的賽道。
國內(nèi)的事實(shí)似乎也說明了這一點(diǎn),有統(tǒng)計(jì)顯示,截至2024年4月底,國內(nèi)共計(jì)推出了305個大模型。而截至5月16日,只有約140個大模型完成了生成式人工智能服務(wù)備案,不足總量的一半……其中一小部分或許是因?yàn)橛糜趯W(xué)術(shù)研究,但大部分則死于彈盡糧絕。
事實(shí)也是,由于大模型賽道的天花板很高,現(xiàn)在的大模型技術(shù)距離理想情況還相差非常遠(yuǎn),所以模型要不斷快速迭代、更新和升級,不斷滿足用戶需求,以及降本增效……這意味著巨大的、無窮無盡的投入,更直接導(dǎo)致了AI還沒有形成生產(chǎn)力,但賣算力卡的英偉達(dá)卻成為全球市值老大。
對于此,巨頭們尚且身不由己,初創(chuàng)企業(yè)怎么獨(dú)善其身?
再舉一個例子,李彥宏和很多行業(yè)觀點(diǎn)對撞的一個判斷,是他認(rèn)為:商業(yè)化模型比開源模型更有潛力和價值。
在“開源模型”十分盛行、部分開源模型宣布取得了比閉源模型取得更好的打榜成績的當(dāng)下,“開源派”聲勢浩大。甚至,扎克伯格這種大佬還親自撰文——《開源AI是前進(jìn)之路》,親自下場為開源站臺。
![]()
怎么看待這個問題,這里,筆者要講兩層意思。
第一層:“開源”在一開始可能是更快、更便宜的,但更有商業(yè)潛力的還是商業(yè)化大模型,因?yàn)樽詈笃吹氖钱a(chǎn)品力。
例如,在差不多10年前,分布式計(jì)算和分布式存儲開始大行其道,國內(nèi)大部分存儲企業(yè)都去用免費(fèi)的分布式系統(tǒng),只有兩家企業(yè)——華為和曙光,決心自研全棧、閉源的分布式存儲體系。
10年過去了,這兩家有自研體系的企業(yè)牢牢占據(jù)了國內(nèi)分布式存儲市場的頭兩名,而那些用開源分布式的企業(yè),受限于對底層技術(shù)的控制能力有限、bug多、沒有技術(shù)支持等方方面面的原因,始終沒法打入頭部市場。
第二層,開源是有標(biāo)準(zhǔn)的,在AI語境下,“偽開源”可能更多。
在軟件時代,開源相對比較簡單,能夠拿到源代碼、二進(jìn)制代碼就算開源。
開源的經(jīng)典精神是——如果開發(fā)人員無法學(xué)習(xí)、使用、修改和共享特定程序,則該程序就不能被稱為開源項(xiàng)目。
根據(jù)這個邏輯,一些專家認(rèn)為,Meta 和谷歌的免費(fèi)大模型(任何人都可以檢查和調(diào)整)并不是真正的開源,因?yàn)椤霸S可證限制了用戶可以對模型做什么,而且訓(xùn)練數(shù)據(jù)集不公開”。
李彥宏的看法則是:“開源模型基本上是?堆參數(shù),?們不知道這些參數(shù)是如何推導(dǎo)出來的,也?法更改這些參數(shù),因此不會對世界各地的?產(chǎn)?影響,也不會讓世界變得越來越好。”
![]()
事實(shí)上,有些模型的開源只是為了營銷,一位專家諷刺的說:”將模型描述為開源可能會使它們被認(rèn)為更值得信賴,即使研究人員無法獨(dú)立調(diào)查它們是否真的是開源的。
但是,在這些爭論成為公眾話題前至少半年,李彥宏就有明確的觀點(diǎn):在商用層面,閉源是終局模式,因?yàn)殚]源遠(yuǎn)比商業(yè)效率高。
簡單說,免費(fèi)的就是最貴的。
這就好像你去A店,免費(fèi)送你一個車的底盤,但你得自己配車殼子、發(fā)動機(jī)和輪胎,還要讓它們組裝起來可以正常運(yùn)轉(zhuǎn);而B店提供二手的整車,且因?yàn)榻?jīng)營規(guī)模大,單車價格能打下來,還提供服務(wù)和救援。
對于不是汽車機(jī)械師的99%的人來說,選擇B店無疑才是符合需求的。對于AI應(yīng)用創(chuàng)新企業(yè)來說,同樣的道理是——企業(yè)不用也不該花錢去打磨大模型,應(yīng)該把這部分資源投入到研發(fā)大模型的創(chuàng)新應(yīng)用上來。
一個有趣的現(xiàn)象是,有時候李彥宏明知自己的觀點(diǎn)還不是行業(yè)共識,但他還是愿意拋磚。
例如,在智能體方面。
百度也在智能體方面發(fā)力,李彥宏對于智能體的看好也由來已久,他認(rèn)為——目前,搜索和大模型的結(jié)合,更多應(yīng)該是在智能體上。
不過,李彥宏說對智能體的判斷時,還說了一句“冷話”:“智能體現(xiàn)在還并不是一個行業(yè)的共識,只是百度下的一個賭注。”
這句話看似突兀,仔細(xì)深思,又覺得李彥宏有李彥宏的道理。
千行百業(yè)競逐智能體,但真正有幾家公司真懂智能體?是真的為了成就智能化而做智能體?
如果問的再尖銳一點(diǎn),大部分企業(yè)對智能體的研發(fā)能投入能占到總研發(fā)經(jīng)費(fèi)的20%嗎?10%?
恐怕一百家里沒有一家。
這就跟我最近追的《小巷人家》這部劇的情節(jié)一樣——莊家堅(jiān)持要讓一雙兒女上高中、考大學(xué)的時候,大家嘴里都說“蠻好蠻好,大學(xué)生有前途”,但是一回頭,還是安排自己的子女上技校、上中專,因?yàn)楹镁蜆I(yè)。
等到一夜間情勢變了,中專、技校不再包分配的時候,這時候大家才是真的意識到,莊家的決策做的太對了,自己在信息繭房里呆的太久,耽誤了兒女的前程。
可以說,直到這一刻“共識”才形成,但絕大多數(shù)人都無法受益于這個共識,因?yàn)樗麄冊凇暗取惫沧R的時候,時機(jī)已經(jīng)悄悄錯過了。
歷史從來不是由共識推動的,而是由先于共識形成時就做出獨(dú)立判斷的人推動的,共識只是塵埃落定后的結(jié)果。
![]()
03
創(chuàng)始人模式的底層邏輯
如果說以上關(guān)于卷應(yīng)用、閉源、智能體的觀點(diǎn)是顯性的,那么,也必然也有解釋這種方向感的隱性因素。
恰好,硅谷最近熱議的“創(chuàng)始人模式”,似乎為我們尋找隱性的底層邏輯提供了線索。
這個定義,出自YC創(chuàng)始人Paul Graham的一篇文章。
它的核心觀點(diǎn)很簡單——相較于只通過下屬掌控公司的職業(yè)經(jīng)理人,親力親為的創(chuàng)始人更有利于一家大公司的發(fā)展。因?yàn)閯?chuàng)始人具有三個職業(yè)經(jīng)理人無法具有的特質(zhì)——
- 創(chuàng)始人相當(dāng)于公司的親生父母;
- 可以完全決策如何作出改變;
- 知道如何重建公司;
說“親力親為”,是不過分的。仔細(xì)想想,和李彥宏同年齡段但還在一號位上的企業(yè)家,著實(shí)已經(jīng)不多。
對于創(chuàng)始人模式的第一條,在十幾年前,我曾經(jīng)和李彥宏本人在一次出差期間,有一個短暫的交流。我問他為何在有些事上堅(jiān)持親力親為,他的回答是:“因?yàn)槟銈冎械娜魏稳硕加锌赡茈x開,但我必須留在這里與百度同生共死,無法離開。”
“創(chuàng)始人模式”中的第二條也適合于百度,那就是“可以完全(自主)決策做出改變”。
我們都知道,百度在自己的第二個10年,也就是移動互聯(lián)網(wǎng)時代,發(fā)展的路徑可謂是跌宕起伏,也錯過了不少機(jī)會。
但是,在國內(nèi)產(chǎn)業(yè)界沒有任何企業(yè)看出AI的潛力(大部分人是在2016年也就是阿爾法狗戰(zhàn)勝人類棋手時,才意識到AI的潛力)的2010年,百度就已經(jīng)將NLP研發(fā)部門從各個業(yè)務(wù)線中獨(dú)立出來,一面攻堅(jiān)前沿技術(shù),一面追求業(yè)務(wù)落地。
事實(shí)上是,早在2006年,百度就已經(jīng)有員工自發(fā)的把人工智能技術(shù)用在產(chǎn)品的提升上。
換言之,百度提前十幾年就開始走自己的AI之路,而且投入了非常高的研發(fā)經(jīng)費(fèi),除了“創(chuàng)始人模式”之外,沒有任何一種可能性能讓一個企業(yè)開始這種高昂的、看似無邊無際的遠(yuǎn)期投入。
第三,我們前面已經(jīng)說過,李彥宏推動了百度所有產(chǎn)品“用AI重做一遍”,這與文中的觀點(diǎn)三即——知道如何重建公司,可謂嚴(yán)絲合縫。
從微觀角度,我不懷疑個人興趣或性格影響了李彥宏對AI的執(zhí)著;但從宏觀角度,如此執(zhí)著的追求,倒不如說AI是他的欲望、信仰和對未來的寄托。
《創(chuàng)始人模式》里有一句話說的很好——他們(創(chuàng)始人)所做的事情,使他們被許多人視為古怪,甚至更糟。但(你要)看看創(chuàng)始人已經(jīng)取得的成就——他們是在逆風(fēng)而行的情況下取得的這些成就。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.