李彥宏的方向感

2024-11-12 22:01:02　來源: 胡說成理

河南舉報

分享至

當(dāng)杰夫·辛頓在2024年獲得諾貝爾獎的時候，他或許會想起12年前的冬天，來找到他的那家叫百度的中國公司。因?yàn)槭前俣茸钤绨l(fā)現(xiàn)了他關(guān)于神經(jīng)網(wǎng)絡(luò)研究的價值，并極力邀請他加盟。

2012年12月初的一天，美國滑雪勝地太浩湖的一家賭場酒店里，杰夫·辛頓和他兩名學(xué)生迎來了四方的競拍者，他們分別來自百度、谷歌、微軟和DeepMind。

辛頓名下的這間叫DNN research公司，其實(shí)沒有任何實(shí)體業(yè)務(wù)，它唯一的資產(chǎn)，其實(shí)就是這三位學(xué)者腦中的學(xué)識。

可能是覺得中國太過于遙遠(yuǎn)，當(dāng)時已經(jīng)年近七旬的辛頓，最后接受了谷歌的出價。

但在彼時的大洋彼岸，中國的信息產(chǎn)業(yè)的諸多企業(yè)中，幾乎沒有人知道發(fā)生過一件這樣的事情，更不知道有一家中國企業(yè)已經(jīng)開始對人工智能的探索。

客觀講，拍板參加這次競拍的百度創(chuàng)始人李彥宏，是一個有方向感的科技企業(yè)家。在過去十幾年里，他的很多關(guān)于AI發(fā)展方向的判斷，都對產(chǎn)業(yè)產(chǎn)生了價值。

但也有人不認(rèn)同他的一些判斷，于是，邊爭論邊發(fā)展，直至逐漸被驗(yàn)證，成為共識，成為這個行業(yè)的有趣現(xiàn)象。

那么，我們不禁要問，李彥宏的方向感，從何而來？

——導(dǎo)語

應(yīng)用來了？！

2024年的百度世界大會，李彥宏的主旨演講，從一個技術(shù)問題開始。

這個問題，叫“AI幻覺”，它特指在生成式人工智能時代，模型生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)或用戶需求不一致的現(xiàn)象。

你也可以簡單的理解為，大模型在一本正經(jīng)的胡說八道。

李彥宏用一個四層的天壇圖片舉例，告訴臺下的聽眾——真正的天壇只有三層，但模型往往會自動生成一幅四層的圖片而不自知。并且，這是所有的生成式模型都會遇到的問題。但在真實(shí)世界里，這類問題往往出現(xiàn)的更加隱蔽且詭異，從而給用戶更多的困擾和誤導(dǎo)。

李彥宏告訴觀眾，百度用RAG（檢索增強(qiáng)）和Image based RAG（/基于檢索增強(qiáng)的文生圖）的技術(shù)，改善了文字和圖像生成中的幻覺問題。

而之所以把這個技術(shù)細(xì)節(jié)放在這次重要的演講的開頭，和李彥宏接下來要作的一個判斷有關(guān)——他認(rèn)為，“AI幻覺”直接導(dǎo)致了“（生成式）多模態(tài)大模型其實(shí)還沒有什么成規(guī)模的應(yīng)用出來”。

故而，在他看來，消除幻覺既是大模型領(lǐng)域在過去24個月實(shí)現(xiàn)的最大進(jìn)展，也應(yīng)該是AI應(yīng)用出現(xiàn)爆發(fā)的起點(diǎn)。基礎(chǔ)模型的能力已經(jīng)就緒，行業(yè)將迎來一個物種大爆炸的應(yīng)用爆發(fā)期。”

如果仔細(xì)的研究李彥宏過去18-24個月的講話，會發(fā)現(xiàn)“應(yīng)用”是一個出現(xiàn)頻率極高的詞匯。

22個月前，也就是早在2023年3月，李彥宏就提醒行業(yè)“不要重復(fù)造輪子”，并表示應(yīng)用才是大模型真正的機(jī)遇。

11個月前，也就是2023年12月16日，李彥宏更直接的表示了自己的焦慮：““我多多少少有點(diǎn)著急”，他在與極客公園的對話中談到：“整個國內(nèi)的AI大模型行業(yè)，現(xiàn)在其實(shí)卷偏了。實(shí)際上，眼下更應(yīng)該抓住的機(jī)遇，是大模型原生應(yīng)用”。

而到了今天，他把2024年的百度世界大會的主題詞定為“應(yīng)用來了”，簡單、直接、強(qiáng)硬。

在實(shí)際行動方面，他在百度內(nèi)部推動了“百度所有業(yè)務(wù)，都要根據(jù)?成式 AI理念重構(gòu)，重做?遍原來的產(chǎn)品”；而在外部，為了給自己心目中的“應(yīng)用潮”再加一把力，他還在會上展示了遴選出來的Top100智能體和Top100產(chǎn)業(yè)應(yīng)用。

在當(dāng)下，談大模型原生應(yīng)用的當(dāng)然遠(yuǎn)非僅李彥宏一個人，但如此執(zhí)著且狂熱的業(yè)者，也著實(shí)不多見。

在筆者看來，李彥宏急于推動大模型的應(yīng)用落地，并非因?yàn)榇竽Ｐ鸵呀?jīng)完美，而是他的底層認(rèn)知決定的。

早在21世紀(jì)的第一個十年，他就反復(fù)的釋放一個觀點(diǎn)：中國由于是（網(wǎng)民人數(shù)）的互聯(lián)網(wǎng)第一大國，就有機(jī)會先遇到問題，進(jìn)而有機(jī)會先去解決這些問題，從而在應(yīng)用創(chuàng)新上實(shí)現(xiàn)跨越。

而這已經(jīng)變成了現(xiàn)實(shí)。

在近年，他把這個觀點(diǎn)濃縮成一個詞匯：“反饋式創(chuàng)新”，在很多場合提及——只有真實(shí)世界的實(shí)際反饋才能持續(xù)驅(qū)動創(chuàng)新。

這也解釋了，為什么他始終認(rèn)為，在大模型通往完美的路上，急需百萬級的“應(yīng)用”作為導(dǎo)航儀，去探索大模型的能力、產(chǎn)品與市場的契合度（PMF）。

但是，真實(shí)世界這次會按照他的判斷而做出改變嗎？

方向感

當(dāng)ChatGPT橫空出世后，在中國出現(xiàn)了百模大戰(zhàn)，數(shù)百家公司紛紛投入大模型這個賽道，資本的眼神都是火熱的。

在很多人為這種圖景叫好、上頭的時候，李彥宏唱了反調(diào)，他認(rèn)為——百模大戰(zhàn)造成了社會資源的巨大浪費(fèi)，尤其是算力的浪費(fèi)，這種局面不可持續(xù)。

但極多人當(dāng)時并不認(rèn)同他的觀點(diǎn)，他們的理由是：只有150個員工時的oepnAI就做出了ChatGPT，那我們?yōu)樯恫荒?搏一搏？

事實(shí)是，雖然openAI起了個大早，但現(xiàn)在各大巨頭的大模型都趕上來了。

這反映了一種現(xiàn)象——巨頭公司往往在行業(yè)出現(xiàn)突破式創(chuàng)新時會因?yàn)轶w量過大、反應(yīng)較慢而落后半步，如IBM、微軟、甲骨文都犯過這樣的錯誤，但一旦龐大的資源和組織被真正動員起來，很容易趕上并碾壓初創(chuàng)公司。

這也幾乎注定了，大模型不是一條對初創(chuàng)公司友好的賽道。

國內(nèi)的事實(shí)似乎也說明了這一點(diǎn)，有統(tǒng)計(jì)顯示，截至2024年4月底，國內(nèi)共計(jì)推出了305個大模型。而截至5月16日，只有約140個大模型完成了生成式人工智能服務(wù)備案，不足總量的一半……其中一小部分或許是因?yàn)橛糜趯W(xué)術(shù)研究，但大部分則死于彈盡糧絕。

事實(shí)也是，由于大模型賽道的天花板很高，現(xiàn)在的大模型技術(shù)距離理想情況還相差非常遠(yuǎn)，所以模型要不斷快速迭代、更新和升級，不斷滿足用戶需求，以及降本增效……這意味著巨大的、無窮無盡的投入，更直接導(dǎo)致了AI還沒有形成生產(chǎn)力，但賣算力卡的英偉達(dá)卻成為全球市值老大。

對于此，巨頭們尚且身不由己，初創(chuàng)企業(yè)怎么獨(dú)善其身？

再舉一個例子，李彥宏和很多行業(yè)觀點(diǎn)對撞的一個判斷，是他認(rèn)為：商業(yè)化模型比開源模型更有潛力和價值。

在“開源模型”十分盛行、部分開源模型宣布取得了比閉源模型取得更好的打榜成績的當(dāng)下，“開源派”聲勢浩大。甚至，扎克伯格這種大佬還親自撰文——《開源AI是前進(jìn)之路》，親自下場為開源站臺。

怎么看待這個問題，這里，筆者要講兩層意思。

第一層：“開源”在一開始可能是更快、更便宜的，但更有商業(yè)潛力的還是商業(yè)化大模型，因?yàn)樽詈笃吹氖钱a(chǎn)品力。

例如，在差不多10年前，分布式計(jì)算和分布式存儲開始大行其道，國內(nèi)大部分存儲企業(yè)都去用免費(fèi)的分布式系統(tǒng)，只有兩家企業(yè)——華為和曙光，決心自研全棧、閉源的分布式存儲體系。

10年過去了，這兩家有自研體系的企業(yè)牢牢占據(jù)了國內(nèi)分布式存儲市場的頭兩名，而那些用開源分布式的企業(yè)，受限于對底層技術(shù)的控制能力有限、bug多、沒有技術(shù)支持等方方面面的原因，始終沒法打入頭部市場。

第二層，開源是有標(biāo)準(zhǔn)的，在AI語境下，“偽開源”可能更多。

在軟件時代，開源相對比較簡單，能夠拿到源代碼、二進(jìn)制代碼就算開源。

開源的經(jīng)典精神是——如果開發(fā)人員無法學(xué)習(xí)、使用、修改和共享特定程序，則該程序就不能被稱為開源項(xiàng)目。

根據(jù)這個邏輯，一些專家認(rèn)為，Meta 和谷歌的免費(fèi)大模型（任何人都可以檢查和調(diào)整）并不是真正的開源，因?yàn)椤霸S可證限制了用戶可以對模型做什么，而且訓(xùn)練數(shù)據(jù)集不公開”。

李彥宏的看法則是：“開源模型基本上是?堆參數(shù)，?們不知道這些參數(shù)是如何推導(dǎo)出來的，也?法更改這些參數(shù)，因此不會對世界各地的?產(chǎn)?影響，也不會讓世界變得越來越好。”

事實(shí)上，有些模型的開源只是為了營銷，一位專家諷刺的說：”將模型描述為開源可能會使它們被認(rèn)為更值得信賴，即使研究人員無法獨(dú)立調(diào)查它們是否真的是開源的。

但是，在這些爭論成為公眾話題前至少半年，李彥宏就有明確的觀點(diǎn)：在商用層面，閉源是終局模式，因?yàn)殚]源遠(yuǎn)比商業(yè)效率高。

簡單說，免費(fèi)的就是最貴的。

這就好像你去A店，免費(fèi)送你一個車的底盤，但你得自己配車殼子、發(fā)動機(jī)和輪胎，還要讓它們組裝起來可以正常運(yùn)轉(zhuǎn)；而B店提供二手的整車，且因?yàn)榻?jīng)營規(guī)模大，單車價格能打下來，還提供服務(wù)和救援。

對于不是汽車機(jī)械師的99%的人來說，選擇B店無疑才是符合需求的。對于AI應(yīng)用創(chuàng)新企業(yè)來說，同樣的道理是——企業(yè)不用也不該花錢去打磨大模型，應(yīng)該把這部分資源投入到研發(fā)大模型的創(chuàng)新應(yīng)用上來。

一個有趣的現(xiàn)象是，有時候李彥宏明知自己的觀點(diǎn)還不是行業(yè)共識，但他還是愿意拋磚。

例如，在智能體方面。

百度也在智能體方面發(fā)力，李彥宏對于智能體的看好也由來已久，他認(rèn)為——目前，搜索和大模型的結(jié)合，更多應(yīng)該是在智能體上。

不過，李彥宏說對智能體的判斷時，還說了一句“冷話”：“智能體現(xiàn)在還并不是一個行業(yè)的共識，只是百度下的一個賭注。”

這句話看似突兀，仔細(xì)深思，又覺得李彥宏有李彥宏的道理。

千行百業(yè)競逐智能體，但真正有幾家公司真懂智能體？是真的為了成就智能化而做智能體？

如果問的再尖銳一點(diǎn)，大部分企業(yè)對智能體的研發(fā)能投入能占到總研發(fā)經(jīng)費(fèi)的20%嗎？10%？

恐怕一百家里沒有一家。

這就跟我最近追的《小巷人家》這部劇的情節(jié)一樣——莊家堅(jiān)持要讓一雙兒女上高中、考大學(xué)的時候，大家嘴里都說“蠻好蠻好，大學(xué)生有前途”，但是一回頭，還是安排自己的子女上技校、上中專，因?yàn)楹镁蜆I(yè)。

等到一夜間情勢變了，中專、技校不再包分配的時候，這時候大家才是真的意識到，莊家的決策做的太對了，自己在信息繭房里呆的太久，耽誤了兒女的前程。

可以說，直到這一刻“共識”才形成，但絕大多數(shù)人都無法受益于這個共識，因?yàn)樗麄冊凇暗取惫沧R的時候，時機(jī)已經(jīng)悄悄錯過了。

歷史從來不是由共識推動的，而是由先于共識形成時就做出獨(dú)立判斷的人推動的，共識只是塵埃落定后的結(jié)果。

創(chuàng)始人模式的底層邏輯

如果說以上關(guān)于卷應(yīng)用、閉源、智能體的觀點(diǎn)是顯性的，那么，也必然也有解釋這種方向感的隱性因素。

恰好，硅谷最近熱議的“創(chuàng)始人模式”，似乎為我們尋找隱性的底層邏輯提供了線索。

這個定義，出自YC創(chuàng)始人Paul Graham的一篇文章。

它的核心觀點(diǎn)很簡單——相較于只通過下屬掌控公司的職業(yè)經(jīng)理人，親力親為的創(chuàng)始人更有利于一家大公司的發(fā)展。因?yàn)閯?chuàng)始人具有三個職業(yè)經(jīng)理人無法具有的特質(zhì)——

創(chuàng)始人相當(dāng)于公司的親生父母；
可以完全決策如何作出改變；
知道如何重建公司；

說“親力親為”，是不過分的。仔細(xì)想想，和李彥宏同年齡段但還在一號位上的企業(yè)家，著實(shí)已經(jīng)不多。

對于創(chuàng)始人模式的第一條，在十幾年前，我曾經(jīng)和李彥宏本人在一次出差期間，有一個短暫的交流。我問他為何在有些事上堅(jiān)持親力親為，他的回答是：“因?yàn)槟銈冎械娜魏稳硕加锌赡茈x開，但我必須留在這里與百度同生共死，無法離開。”

“創(chuàng)始人模式”中的第二條也適合于百度，那就是“可以完全（自主）決策做出改變”。

我們都知道，百度在自己的第二個10年，也就是移動互聯(lián)網(wǎng)時代，發(fā)展的路徑可謂是跌宕起伏，也錯過了不少機(jī)會。

但是，在國內(nèi)產(chǎn)業(yè)界沒有任何企業(yè)看出AI的潛力（大部分人是在2016年也就是阿爾法狗戰(zhàn)勝人類棋手時，才意識到AI的潛力）的2010年，百度就已經(jīng)將NLP研發(fā)部門從各個業(yè)務(wù)線中獨(dú)立出來，一面攻堅(jiān)前沿技術(shù)，一面追求業(yè)務(wù)落地。

事實(shí)上是，早在2006年，百度就已經(jīng)有員工自發(fā)的把人工智能技術(shù)用在產(chǎn)品的提升上。

換言之，百度提前十幾年就開始走自己的AI之路，而且投入了非常高的研發(fā)經(jīng)費(fèi)，除了“創(chuàng)始人模式”之外，沒有任何一種可能性能讓一個企業(yè)開始這種高昂的、看似無邊無際的遠(yuǎn)期投入。

第三，我們前面已經(jīng)說過，李彥宏推動了百度所有產(chǎn)品“用AI重做一遍”，這與文中的觀點(diǎn)三即——知道如何重建公司，可謂嚴(yán)絲合縫。

從微觀角度，我不懷疑個人興趣或性格影響了李彥宏對AI的執(zhí)著；但從宏觀角度，如此執(zhí)著的追求，倒不如說AI是他的欲望、信仰和對未來的寄托。

《創(chuàng)始人模式》里有一句話說的很好——他們（創(chuàng)始人）所做的事情，使他們被許多人視為古怪，甚至更糟。但（你要）看看創(chuàng)始人已經(jīng)取得的成就——他們是在逆風(fēng)而行的情況下取得的這些成就。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.