Sam Altman似乎真的沒(méi)轍了?
繼去年年底連發(fā)12天新功能,最后以Sora撲街收?qǐng)龊螅裉煸缟螼penAI發(fā)布的GPT-4.5,又被各路網(wǎng)友罵瘋。
![]()
(網(wǎng)友留言吐槽OpenAI的領(lǐng)導(dǎo)層因壓力所迫而讓員工東拼西湊地發(fā)布)
簡(jiǎn)單概括一下GPT-4.5的關(guān)鍵信息。它不是推理模型,而是基礎(chǔ)模型,OpenAI認(rèn)為它的特點(diǎn)是知識(shí)更廣、情商超高。
網(wǎng)友們認(rèn)為,GPT-4.5雖然基準(zhǔn)測(cè)試GPT-4o,但預(yù)訓(xùn)練計(jì)算量是GPT-4的10倍;代碼能力雖然超越了DeepSeek-R1、o1、GPT-4o等模型,但趕不上Claude 3.7;每1M tokens輸入價(jià)格為75刀,輸出價(jià)格為150刀,是其他模型的10-100倍。
總之,被宣傳了很久的GPT-4.5(也就是之前的Orion)一亮相,就因?yàn)閮r(jià)格昂貴、亮點(diǎn)不足,成為眾矢之的。
被中國(guó)AI卷到,OpenAI持續(xù)劃水
網(wǎng)友們的失望或許可以理解。
畢竟,GPT-4.5是GPT-4之后的發(fā)布的新一代基座模型,大家理所當(dāng)然地認(rèn)為GPT-4.5也應(yīng)該和GPT-4發(fā)布時(shí)一樣驚艷。
再加上,中國(guó)AI公司的技術(shù)能力正在被全球認(rèn)可,這讓OpenAI更顯尷尬。
從12月DeepSeek-V3以不到600萬(wàn)美元的訓(xùn)練成本出圈后,阿里、騰訊、字節(jié)、Kimi、階躍、MiniMax等中國(guó)公司都在模型層和開(kāi)源領(lǐng)域發(fā)力。甚至,前兩天通義Wan2.1的發(fā)布會(huì)時(shí)間定在了晚間23點(diǎn)。
最新的重磅消息是,就在GPT-4.5發(fā)布的今天,百度官宣將于3月16日發(fā)布文心大模型4.5 。
![]()
2月27日,海外媒體路透社也爆料了百度文心將在3月中旬發(fā)布升級(jí)版的消息,還透露了該模型在推理等方面的能力將有所提升。
沒(méi)想到今天百度就自己揭開(kāi)了面紗。
文心4.5有什么花活?
公開(kāi)資料顯示,百度文心大模型是全球最早對(duì)標(biāo)GPT的大語(yǔ)音大模型之一,并計(jì)劃將在今年內(nèi)發(fā)布5.0版本(OpenAI也預(yù)計(jì)在年內(nèi)推出GPT-5)。
最近,百度的AI動(dòng)作明顯頻繁了起來(lái)。
首先是CEO李彥宏“想開(kāi)了”,開(kāi)始擁抱開(kāi)源。
而且,百度還打出“生態(tài)和免費(fèi)”組合拳——文小言、百度搜索、百度智能云、文心智能體等產(chǎn)品全面接入DeepSeek;文心一言PC端和APP端將在4月1日全面免費(fèi);6月30日,開(kāi)源文心大模型4.5系列。
![]()
(百度近期動(dòng)態(tài)時(shí)間線)
接下來(lái)好奇的是,頂著百度史上最強(qiáng)大模型稱號(hào)的文心4.5,會(huì)在哪些方面體現(xiàn)出不一樣?
對(duì)比目前市面上主流的大模型,文心的特點(diǎn)是能力比較全面,具備深度思考、RAG、多模態(tài)、深度搜索、文生圖、代碼生成等功能。從這個(gè)角度,或許文心4.5會(huì)依舊堅(jiān)持功能全面的路線。
![]()
(主流大模型開(kāi)發(fā)能力對(duì)比,來(lái)源:百度)
其中,最值得期待的是模型的精準(zhǔn)性。
百度基本是唯一強(qiáng)調(diào)RAG和iRAG的大模型公司——這和過(guò)去多年的搜索技術(shù)有關(guān)。去年百度公開(kāi)的iRAG技術(shù),主要特征就是大幅降低了圖片生成的幻覺(jué),而且成本很低。
之前百度APP的新年全球拜年的活動(dòng)中,這一技術(shù)被數(shù)千萬(wàn)用戶體驗(yàn),玩出了不少“花活”。
距離上次發(fā)布也過(guò)去一年,又有不少數(shù)據(jù)和用戶反饋沉淀了下來(lái),相信這次文心大模型迭代應(yīng)該會(huì)不會(huì)放過(guò)這個(gè)“殺手锏”,在去“ai味”和降低幻覺(jué)方面,應(yīng)該會(huì)更加精進(jìn)。
另一個(gè)好奇的點(diǎn),是價(jià)格。
訓(xùn)練和推理成本是影響大模型價(jià)格的重要因素。一家公司是否敢開(kāi)源、免費(fèi),與大模型不斷降低的訓(xùn)練和推理成本相關(guān)。比如,DeepSeek剛剛結(jié)束的開(kāi)源Week,就一直公開(kāi)自家在底層Infra上的秘訣。
![]()
(DeepSeek開(kāi)源Week速覽,來(lái)源:鈦媒體)
百度也持續(xù)布局AI Infra。
首先在芯片層它有昆侖芯萬(wàn)卡集群,可以在更少的計(jì)算資源下運(yùn)行大規(guī)模模型(如DeepSeek-V3/R1)。另外,百度旗下百舸平臺(tái)還通過(guò)高效并行化任務(wù)切分策略等方法,提升整體集群訓(xùn)練效率,保障集群有效訓(xùn)練率達(dá)到98%。飛槳也有很多大模型推理的自研技術(shù)。
李彥宏在2024年曾透露,自發(fā)布以來(lái),文心大模型的推理成本已降低至一年前的1%。
至于馬上就要面世的文心4.5,李彥宏則認(rèn)為,文心大模型4.5將是百度有史以來(lái)最強(qiáng)大的大模型。
相信有Infra技術(shù)支撐,文心4.5的價(jià)格一定不會(huì)像GPT4.5一樣離譜。
在更多細(xì)節(jié)上,李彥宏還預(yù)告文心4.5在將基礎(chǔ)模型能力上大幅提升,還能具備原生多模態(tài)、深度思考等能力。路透社的消息中也透露,這個(gè)模型的推理能力將大幅提升。
百度至今還沒(méi)有正式發(fā)布過(guò)自家的推理模型,這次預(yù)告文心4.5結(jié)合了多模態(tài)和深思考,似乎暗示它將是一個(gè)擁有高智商的基礎(chǔ)模型。
作為國(guó)內(nèi)最早對(duì)標(biāo)GPT的文心,能延續(xù)中國(guó)AI卷向全球的神話嗎?半個(gè)月后,答案即將揭曉。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.