AI圈迎來重磅官宣:困擾業(yè)內(nèi)已久的Token中文名,終于有了官方定論——詞元!
近日,國家數(shù)據(jù)局在官方公告中首次啟用“詞元”作為Token的標(biāo)準(zhǔn)譯名。這標(biāo)志著,這一AI核心術(shù)語在中文人工智能領(lǐng)域正式“定調(diào)”,從此告別翻譯混亂的局面。
更讓人震撼的是,在國新辦3月24日的新聞發(fā)布會上,國家數(shù)據(jù)局局長劉烈宏披露了一組亮眼的數(shù)據(jù):截至今年3月,我國日均詞元調(diào)用量已突破140萬億!
![]()
(圖片來源:新浪微博)
這個數(shù)字有多驚人?對比一下就懂了:相比2024年初的1000億,增長了1000多倍;就連對比2025年底的100萬億,短短三個月也實現(xiàn)了40%以上的增長。中國AI的發(fā)展速度,肉眼可見的迅猛。
劉烈宏表示,詞元調(diào)用量的爆發(fā)式增長,正是中國人工智能進入快速增長階段的最好證明。如今AI的應(yīng)用場景不斷深化,早已從簡單的對話升級到了能決策、能執(zhí)行的智能體。而備受關(guān)注的詞元出海,更是我國AI產(chǎn)業(yè)競爭力增強的直接體現(xiàn)。
可能有人會問,到底什么是詞元?這個理解起來一點都不復(fù)雜,《人民日報》早在今年1月就發(fā)布科普文章,將詞元定義為“處理文本的最小數(shù)據(jù)單元”。
簡單來說,就是AI大模型處理數(shù)據(jù)時,拆分出的“最小信息載體”,可以是一個字、一個詞片段,甚至一個符號。
舉個通俗的例子:“我愛中國!”這句話,在AI眼里就會被拆分成“我”、“愛”、“中國”、“!”四個詞元,是不是一下子就懂了?
值得一提的是,目前蘋果中國官網(wǎng)、央視新聞、中國計算機學(xué)會等,都已統(tǒng)一使用“詞元”這一表述,足以見得它的權(quán)威性。
其實不難發(fā)現(xiàn),互聯(lián)網(wǎng)時代的核心度量是流量,而到了人工智能時代,詞元正在成為新的關(guān)鍵指標(biāo)。我們給AI輸入的每一個字,AI生成的每一段話、識別的每一幅圖像,本質(zhì)上都在消耗詞元。
從術(shù)語統(tǒng)一到調(diào)用量爆發(fā),這背后是中國AI產(chǎn)業(yè)的穩(wěn)步崛起,也是智能時代加速到來的信號。未來,隨著詞元相關(guān)體系的不斷完善,中國AI還會帶來哪些驚喜?值得我們共同期待!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.