![]()
始智AI wisemodel.cn社區(qū)是源自中國的中立開放的AI開源社區(qū)。正在,歡迎加入共同成長。
智譜正式發(fā)布并開源GLM-ASR系列語音識別模型,并推出基于該系列模型打造的桌面端智譜AI輸入法。
本次發(fā)布的模型與產(chǎn)品包括:GLM-ASR-2512:全球領(lǐng)先的云端語音識別模型;GLM-ASR-Nano-2512:參數(shù)量僅1.5B的開源SOTA端側(cè)語音模型;智譜AI輸入法:將語音識別與大模型深度融合的桌面端效率工具。
智譜希望讓用戶真正做到“動(dòng)動(dòng)嘴,活就干了”,助力用戶從“把話變成字”走向“直接用語音完成任務(wù)”。已上線始智AI-wisemodel開源社區(qū),歡迎體驗(yàn)。
![]()
模型地址
https://wisemodel.cn/models/ZhipuAI/GLM-ASR-Nano-2512
01.
GLM-ASR系列模型開源
GLM-ASR-2512是智譜新一代語音識別模型,支持將語音實(shí)時(shí)轉(zhuǎn)換為文字。在多場景、多語種、多口音的真實(shí)復(fù)雜環(huán)境測試中,該模型保持行業(yè)領(lǐng)先的識別表現(xiàn),字符錯(cuò)誤率(CER)僅為0.0717。
在此基礎(chǔ)上,智譜開源了GLM-ASR-Nano-2512。這是一個(gè)1.5B參數(shù)的端側(cè)模型,卻取得了當(dāng)前開源語音識別方向的SOTA表現(xiàn),并在部分測試中優(yōu)于若干閉源模型。該模型將識別能力壓縮到本地運(yùn)行,在保證高精度的同時(shí),實(shí)現(xiàn)更強(qiáng)的隱私保護(hù)與更低的交互延遲。
![]()
基于上述模型能力,智譜正式上線智譜AI輸入法,讓用戶在PC端用語音絲滑交互。用戶不但可以實(shí)現(xiàn)精準(zhǔn)的語音轉(zhuǎn)文字,還可以實(shí)現(xiàn)翻譯、改寫等智能操作,真正實(shí)現(xiàn)“指尖即模型,語音即指令”。
02.
智譜AI輸入法:
在輸入中直接調(diào)起模型能力
智譜AI輸入法基于GLM-ASR系列模型打造,讓用戶在電腦端用語音絲滑交互。用戶不僅可以實(shí)現(xiàn)精準(zhǔn)的語音轉(zhuǎn)文字,還可以在輸入法中直接調(diào)用大模型能力,完成翻譯、改寫、情緒轉(zhuǎn)化等操作,實(shí)現(xiàn)“指尖即模型,語音即指令”。
所選即所改,從聽寫到改寫的一體化:傳統(tǒng)輸入法只負(fù)責(zé)打字,而智譜AI輸入法直接調(diào)用底層GLM模型幫助用戶翻譯、擴(kuò)寫、精簡屏幕上的任意一段文字,同時(shí)完成智能潤色,讓輸出更加自然、通順。整個(gè)過程在輸入框內(nèi)完成,實(shí)現(xiàn)“理解-執(zhí)行-替換”一體化,無需在多個(gè)應(yīng)用間反復(fù)切換。
千人千面人設(shè)切換:支持設(shè)置不同“人設(shè)”風(fēng)格,實(shí)現(xiàn)同一句話在不同場景下的不同表達(dá)。例如,在工作場景中,選擇“面對老板”,口語化的碎碎念瞬間轉(zhuǎn)化為邏輯嚴(yán)謹(jǐn)、條理清晰的工作匯報(bào);在生活場景中,切換至“面對伴侶”,文字則變得溫柔俏皮,貼近日常聊天語境。
Vibe Coding(語感編程)搭子:針對開發(fā)者,智譜特別推出了Vibe Coding體驗(yàn),并與智譜Coding Plan賬號打通。結(jié)合多語言支持與代碼理解能力,開發(fā)者可以通過語音快速輸入代碼邏輯和注釋、查找遺忘的Linux指令、用自然語言指揮AI完成復(fù)雜數(shù)學(xué)計(jì)算或腳本編寫。同樣,設(shè)計(jì)師也可以從傳統(tǒng)的“用手摳圖”過渡到“用嘴做設(shè)計(jì)”。
耳語捕捉與高效熱詞:針對開放式辦公室、圖書館等公共場景,智譜優(yōu)化了對微弱聲音的捕捉能力,并區(qū)分環(huán)境噪聲。用戶只需輕聲說話,即可精準(zhǔn)轉(zhuǎn)為文字,解決公共場合“不好意思用語音輸入”的痛點(diǎn)。同時(shí),該輸入法支持用戶一鍵導(dǎo)入專屬詞匯、項(xiàng)目代號(如AutoGLM)及生僻人名、地名等。用戶只需在設(shè)置中添加一次即可。
----- END -----
![]()
wisemodel相關(guān):
系列模型:
關(guān)于wisemodel更多
1
歡迎持續(xù)關(guān)注和支持
![]()
開源社區(qū)建設(shè)需要長期堅(jiān)持和投入,更需要廣大用戶的積極參與、貢獻(xiàn)和維護(hù),歡迎大家加入wisemodel開源社區(qū)的志愿者計(jì)劃和開源共創(chuàng)計(jì)劃。期待更多開發(fā)者將開源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開放的AI開源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開源社區(qū)動(dòng)態(tài)。
2
歡迎加盟wisemodel開源社區(qū)
始智AI wisemodel社區(qū)自2023年9月上線以來,逐漸成為影響力日益擴(kuò)大的中立開放的AI開源社區(qū),為了加快公司發(fā)展,我們長期需要技術(shù)、運(yùn)營等人才加盟,技術(shù)側(cè)重在AI infra、后端開發(fā),熟悉K8S、模型訓(xùn)練和推理等技術(shù), 以及熟悉開發(fā)者生態(tài)運(yùn)營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn
3
歡迎投稿優(yōu)質(zhì)內(nèi)容
歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵(lì)高校實(shí)驗(yàn)室、大企業(yè)研究團(tuán)隊(duì)、個(gè)人等,在wisemodel平臺上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開源成果介紹,也可以是關(guān)于AI技術(shù)實(shí)踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。
4
關(guān)于wisemodel開源社區(qū)
始智AI wisemodel.cn開源社區(qū)由清華校友總會AI大數(shù)據(jù)專委會副秘書長劉道全創(chuàng)立,旨在打造和建設(shè)中立開放的AI開源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開源社區(qū),匯聚主要AI開源模型、數(shù)據(jù)集和代碼等,歡迎高校科研院所、大型互聯(lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個(gè)人開發(fā)者,以及政府部門、學(xué)會協(xié)會、聯(lián)盟、基金會等,還有投資機(jī)構(gòu)、科技媒體等,共同參與建設(shè)AI開源創(chuàng)新生態(tài)。
向上滑動(dòng)查看
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.