337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

國產免費2B開源語音模型征服《莽撞人》!復刻郭德綱最難貫口

0
分享至

金磊 發自 凹非寺
量子位 | 公眾號 QbitAI

終于,郭德綱最難的貫口——莽撞人,被免費的2B國產AI給復刻出來了!

來,展示~



△圖片和音頻均為AI生成

視頻地址:
https://mp.weixin.qq.com/s/77mbsD2cSqW8_NIMW6LE2Q

這段《莽撞人》是被公認的難度頂尖,甚至成為北影臺詞課的教科書范本,很多專業演員面對它也是望而卻步。

而之前AI語音模型要復刻這段貫口,要么速度不夠快,要么咬字、節奏錯誤,要么就是莫得感情。

但這一次,AI“無中生有”自行音色設計出來的女聲版貫口,不僅把節奏拿捏到位,甚至連百(bē)戰百(bē)勝白(bē)盔白(bē)甲白(bē)旗靠……這些特殊發音也是讀對了!

包括這兩天在網上包括的沈陽翻譯片段,這個免費國產AI也是分分鐘能復刻出來男聲版



△圖片和音頻均為AI生成

視頻地址:
https://mp.weixin.qq.com/s/77mbsD2cSqW8_NIMW6LE2Q

那幾個被網友們笑瘋了的小詞兒:“音樂會兒”“害有”,國產AI把大姨東北話的靈魂給抓得穩穩的。

不止是東北話,這個語言模型已經可以cover九種方言,像四川話版《大話西游》經典名場面,是這樣的:

(注:九種方言分別是四川話、粵語、吳語、東北話、河南話、陜西話、山東話、天津話、閩南語。)



△圖片和音頻均為AI生成

視頻地址:
https://mp.weixin.qq.com/s/77mbsD2cSqW8_NIMW6LE2Q

“巴適得板”、“悔得摳腳”、“女娃兒”……

這小味兒確實有點滿級四川方言的味道了,而且還把周星馳原配音的聲色給保住了。

除了方言啊,這個國產2B模型還有一技——同一段語音可以用不同國家的語言來演繹!

例如這段原先是中文的《甄嬛傳》滴血驗親的名片段,就秒變成了韓語版:



△圖片和音頻均為AI生成

視頻地址:
https://mp.weixin.qq.com/s/77mbsD2cSqW8_NIMW6LE2Q

不論是語氣還是人聲,都有點中文原版的那個味道了。

當然,泰語版西語版,也是手拿把掐:



△圖片和音頻均為AI生成

視頻地址:
https://mp.weixin.qq.com/s/77mbsD2cSqW8_NIMW6LE2Q

不僅如此啊,這個語音模型是直接可以cover三十門外語的那種。

來聽一下30種不同風格的“你好”:



如此好玩,還免費開源的國產語音模型,到底是何許AI是也?

不賣關子,它正是面壁智能聯合OpenBMB開源社區清華大學人機語音交互實驗室新升級的VoxCPM 2

整體看下來,除了多語種、多方言之外,VoxCPM 2在音色設計音色可控高表現力方面也是較為亮眼。

不少歪果仁在VoxCPM 2發布之后就立馬去嘗了下鮮,紛紛表示“自家語言的效果針不戳!”



而且在音質方面,市面一般是24000Hz,但VoxCPM 2這次直接拔高到了48000Hz(CD音質)!

這下子,游戲、動畫、影視、有聲書等領域的人可以說是有福了。

生成只需1秒鐘的語音模型

開源的VoxCPM 2,我們現在就可以在在線體驗的網站上體驗了(地址見文末):



接下來,我們就一起手把手,搓一個東北話版《火影忍者》

首先在界面的左上角,我們上傳一段宋小寶的原聲片段,大概20秒左右:



然后在它的下方,我們填一個“東北話”的指令,再把臺詞寫進要合成的文本里,例如:

擱這兒用穢土轉生跟我嘮嗑,可真夠損的奧。



最后點擊下面的“Generate Speech”按鈕,不到一秒鐘的時間,宋小寶味兒的《火影》宇智波斑的臺詞就誕生了:



接下來,我們只需要配上一小段視頻,齊活兒:

細心的小伙伴可能發現了,剛才宋小寶音頻的demo里其實是有背景雜音的,但到視頻里就沒有了。

這其實是VoxCPM 2的參考音頻降噪功能,只要勾選一下,聲音就會變得清晰:



還有值得注意的是,視頻里二代土影的聲音,是沒有上傳任何參考音頻的情況下生成。

如果你找不到合適的靈感,大可以讓VoxCPM 2自由發揮。

然后如果想克隆聲音的質量有保證,建議上傳的參考音頻盡量大于等于5秒;以及你還可以在“Control Instruction”里面添加提示詞,改變參考聲音的情緒和語速等等。

(但克隆聲音的時候,是不能改變性別的哦~)

除此之外,還有3個小細節:



第一個是文本規范化,這是在你輸入的臺詞里有日期、符號、阿拉伯數字等AI讀不明白的內容時,你就可以點它,讓AI讀得規范起來。

第二個CFG Value,它的作用是用來控制AI的聽話程度,數值越高就越聽你的要求,反之,AI會自由發揮。

第三個就是LocDiT,設置它的步數越高,音頻效果就會越好,但生成的速度就會變慢。

除此之外,臺詞中間停頓的音效,現在可以用[laughing](笑聲)、[sigh](嘆氣)、[Uhm](嗯……)這些標簽來控制:



總而言之,現在要玩兒逼真、有趣的聲音,簡直太簡單了。

怎么做到的?

看到這里,肯定有不少的小伙伴要問了:

只有2B大小,還免費開源的語音模型,到底是怎么做到的?

來,咱們這就扒一波。

首先就是VoxCPM 2走了一條跟市面上大多數模型不太一樣的路線——采用擴散自回歸連續表征(Diffusion Autoregressive Continuous Representation)。

和市面上主流的Token-based傳統方案不同的是,它是基于Tokenizer-Free的TTS系統來做的設計,通過端到端擴散自回歸架構直接生成連續語音表征,實現了隱式語義-聲學的解耦。

簡單來說,傳統方案在語音轉換時極易出現信息損失,而這套技術能最大程度保留原始聲音的聲學細節、情感基調和方言特色。

這也就是它既能完美復刻周星馳配音的聲色,又能把東北話、四川話說得地道入味的核心原因。

與此同時,這款模型的底氣,還來自面壁智能深耕多年的高密度小模型技術壁壘。VoxCPM 2完全基于面壁智能自研的MiniCPM基座打造,延續了系列模型“小身板、大能量”的特質。

此前VoxCPM系列就已經在Hugging Face斬獲超千點贊、5.5k+下載量,這次升級更是把多語種、高保真、音色可控等核心能力拉到了行業新高度。

更難得的是,VoxCPM 2不止開源了完整的模型權重,更提供了從一鍵上手到大規模部署的全套工具鏈,支持原生Torch推理、LoRA及全參數微調,還適配了多端UI擴展,上手使用變得超簡單。

最后回到國產這個點。

放眼全球范圍內,目前除了基座大模型牢牢占據了開源領先地位,在小模型、端側模型上,中國公司也在持續領先。

體驗地址:
https://voxcpm.modelbest.cn/

GtiHub地址:
https://github.com/OpenBMB/VoxCPM/

HuggingFace地址:
https://huggingface.openbmb.com/model/openbmb/VoxCPM2

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網傳全紅嬋遭微信群長期網暴,若屬實,體育管理部門責無旁貸

網傳全紅嬋遭微信群長期網暴,若屬實,體育管理部門責無旁貸

胡言炫語
2026-04-08 02:39:28
全紅嬋遭群聊辱罵再升級!國家一錘定音,主謀被扒,勢力大也沒用

全紅嬋遭群聊辱罵再升級!國家一錘定音,主謀被扒,勢力大也沒用

閱微札記
2026-04-08 19:55:14
伊朗媒體披露全部10項停戰條款

伊朗媒體披露全部10項停戰條款

財聯社
2026-04-08 11:12:26
突發訃告!王克林逝世

突發訃告!王克林逝世

吉刻新聞
2026-04-08 23:09:10
脫口秀女演員思文官宣生子:正式介紹下,我兒子多多;此前發文與脫口秀演員程璐離婚

脫口秀女演員思文官宣生子:正式介紹下,我兒子多多;此前發文與脫口秀演員程璐離婚

極目新聞
2026-04-08 12:16:43
涉嫌嚴重違紀違法!山東省紀委監委通報:2人被查

涉嫌嚴重違紀違法!山東省紀委監委通報:2人被查

閃電新聞
2026-04-08 16:33:23
李璇:感覺中足聯放了李鎮全被罰的風,然后收回去了

李璇:感覺中足聯放了李鎮全被罰的風,然后收回去了

懂球帝
2026-04-09 00:30:09
詐尸了!哈梅內伊死而復生?特朗普大秀軍功,伊朗做出了一個舉動

詐尸了!哈梅內伊死而復生?特朗普大秀軍功,伊朗做出了一個舉動

嫹筆牂牂
2026-04-08 10:15:22
回顧:緬北女魔頭魏榕嗜好!經常“活剝驢耳”,3個閨蜜喜歡觀刑

回顧:緬北女魔頭魏榕嗜好!經常“活剝驢耳”,3個閨蜜喜歡觀刑

飛云如水
2024-11-13 06:54:13
美國人意識到,貿易戰之后,不會再有中國外的大規模工業化國家了

美國人意識到,貿易戰之后,不會再有中國外的大規模工業化國家了

孤城落葉
2026-04-09 01:04:27
A股:股民系好安全帶,主力資金信號明確,4月9日周四將歷史重演

A股:股民系好安全帶,主力資金信號明確,4月9日周四將歷史重演

云鵬敘事
2026-04-09 00:00:09
新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
4月必辦!2個證件全國發放,人人都有,沒領的抓緊辦

4月必辦!2個證件全國發放,人人都有,沒領的抓緊辦

混沌錄
2026-04-08 18:28:12
美媒:美軍的新導彈讓中國大吃一驚,解放軍的殺手锏已經沒用了

美媒:美軍的新導彈讓中國大吃一驚,解放軍的殺手锏已經沒用了

清衣渡a
2026-04-08 11:22:10
撞臉彭于晏的上海民警在杭州執勤時走紅,最近“相親到崩潰”?對象一亮相,網友直呼太般配

撞臉彭于晏的上海民警在杭州執勤時走紅,最近“相親到崩潰”?對象一亮相,網友直呼太般配

極目新聞
2026-04-08 07:34:31
馬士基暫不恢復霍爾木茲航線

馬士基暫不恢復霍爾木茲航線

每日經濟新聞
2026-04-08 22:39:29
殺人誅心!拜仁2-1客勝皇馬,主帥孔帕尼賽后發言暗藏捧殺玄機!

殺人誅心!拜仁2-1客勝皇馬,主帥孔帕尼賽后發言暗藏捧殺玄機!

田先生籃球
2026-04-08 09:06:27
全紅嬋遭群聊辱罵再升級!國家一錘定音,主謀被扒,勢力大也沒用

全紅嬋遭群聊辱罵再升級!國家一錘定音,主謀被扒,勢力大也沒用

攬星河的筆記
2026-04-08 20:18:29
伊朗媒體:伊朗拉萬煉油廠發生爆炸

伊朗媒體:伊朗拉萬煉油廠發生爆炸

環球網資訊
2026-04-08 16:49:39
曝京東攔截員工使用外部AI,美團內部開始限制阿里Qwen模型

曝京東攔截員工使用外部AI,美團內部開始限制阿里Qwen模型

IT之家
2026-04-08 11:33:06
2026-04-09 02:27:00
量子位 incentive-icons
量子位
追蹤人工智能動態
12443文章數 176446關注度
往期回顧 全部

娛樂要聞

侯佩岑全家悉尼度假,一家四口幸福滿溢

頭條要聞

伊朗武裝部隊:伊朗對美以絕不信任

頭條要聞

伊朗武裝部隊:伊朗對美以絕不信任

體育要聞

40歲,但實力倒退12年

財經要聞

天津海河乳業回應直播間涉黃

科技要聞

造出地表最強AI,卻死活不給你用!

汽車要聞

20萬級滿配華為全家桶 華境S是懂家庭的大六座

態度原創

游戲
家居
教育
親子
數碼

真愛拉電線!《終末地》日本市場收入超中國:全球第一

家居要聞

自在恣意 侘寂風別墅

教育要聞

高考地理|什么是"下擊暴流"?

親子要聞

胡圖圖說他差幾分就能兌換發卡

數碼要聞

小米多款新品本月發,看看你期待哪款?

無障礙瀏覽 進入關懷版