新音樂產業觀察原創文章,未經授權謝絕轉載
作者 | 朱力克
在發展顯著提速的當下,AI已經以一種非常具體的方式進入音樂行業。
有職業音樂人抱怨,因為廣告公司改用AI音樂,自己在半年內失去了多份定制音樂合同;另有游戲音樂從業者表示,在引入AI工具之后,其公司的錄音師團隊從4人減少到1人。
廣告音樂和游戲音樂等都屬于典型的功能性音樂,制作流程高度標準化,恰恰在這一領域,AI音樂具有顯而易見的替代性。
功能性音樂只是行業變革的前沿陣地,隨著AI作曲家和AI制作人登場,大量依賴標準化流程的工作崗位正在被重新劃分,“搶飯碗”不再是危言聳聽,而是一種正逐漸顯現的現實。
但與此同時,另一種變化也正在出現,當標準化生產逐漸被AI接管,人類創作者反而將聚焦于更能發揮創造力的“非標準化工作”。
在這個巨變的周期里,行業急需在技術替代與創意共生之間尋找新的平衡點。
親測,AI音樂已經夠用了
過去兩年,AI音樂的發展大致沿著兩條路徑同步推進。
一條路徑是普適化,豆包和Gemini等泛AI平臺已經集成音樂工具,將AI生成音樂轉化為可被廣泛調用的基礎生產力能力;另一條路徑則是專業化,Suno和MiniMax等廠商開始針對具體行業場景進行模型優化,使生成音樂真正具備進入商業生產流程的條件。
今年年初,MiniMax推出MiniMax Music 2.5,將歌曲生成能力提升至格萊美級別。對此,我們曾在《AI音樂的下半場,誰能夠真正上岸?》一文分析認為,MiniMax Music 2.5顯示出AI音樂已經發展為能夠對接行業需求的專業級生產工具。
而最新推出的Music 2.5+則進一步補齊了純音樂生成這一環節,使整個Music 02系列逐漸成為一個沒了短板的“水桶型模型”。
![]()
這一變化看似只是功能補全,但實際上意義不小。
關于AI音樂的討論,人們往往更關注“AI寫歌”,但在實際商業應用中,需求量更大的往往是功能性純音樂,廣告、游戲、影視、播客、直播、電商視頻……幾乎所有內容產業都需要大量背景音樂。
當AI模型在純音樂生成能力上達到可用水平時,也就意味著AI真正具備了進入商業音樂生產流程的能力。
為了更直觀地理解這一變化,我們簡單做了一系列測試,針對不同場景用MiniMax Music2.5+生成幾段音樂,包括強調劇情感的游戲音樂、強調氛圍感的助眠類純音樂和強調情緒引導的廣告音樂等。為了體驗AI的智能性,我們還盡可能簡化提示詞。
1.游戲音樂
提示詞:游戲音樂
生成結果呈現出較清晰的劇情變化,音樂開頭以鋼琴和氛圍音效鋪墊節奏,隨后逐漸加入弦樂和打擊樂,使整體張力不斷增強。中段出現短暫過渡后,多樂器組合進入更高強度的節奏段落。整體來看,這段音樂已經具備較明顯的劇情推進感,符合動作或冒險類游戲配樂常見的編排邏輯。
2.療愈音樂
提示詞:國風,自然采樣,療愈
生成結果以鳥鳴和海浪等自然環境音作為開頭,輔以彈撥類樂器作為鋪墊。整體節奏較為平緩,旋律變化較少,主要通過自然聲景與輕音樂器維持穩定的氛圍感。這種設計與助眠或冥想類音樂常見的制作思路較為一致,即通過低強度旋律和持續聲場構建放松氛圍。
3.廣告音樂
提示詞:電子產品廣告音樂
生成音樂整體節奏感較強,以電子節拍為基礎,并加入打擊樂強化律動。旋律結構相對簡潔,節奏推進直接,使情緒表達更加集中。這種明快且節奏突出的音樂類型,與廣告或品牌宣傳視頻中常見的配樂風格較為接近。
4.Lo-Fi音樂
提示詞:辦公室Lo-Fi
生成音樂以電吉他作為主旋律,通過輕快掃弦進行節奏鋪墊,在鼓組節拍的帶動下形成穩定律動,背景中還加入輕微的黑膠顆粒噪聲,為音樂增加了典型的Lo-Fi質感,使整體氛圍更加松弛,適合用作工作背景音樂。
5.泛化音樂
提示詞:電子舞曲,爵士,中國風,凱爾特,古典音樂,印度
這一測試主要用于觀察模型的大跨度泛化能力,電子舞曲的鼓點構成基礎結構,而旋律與音色中則出現一些帶有民族風格特征的元素,使音樂呈現出一定的跨文化風格混合。即使多流派混搭,模型也能保持整體的音樂結構不亂。
綜合看來,僅使用較為簡單的提示詞,AI生成音樂已經能夠形成相對完整的結構框架,如果進一步引入精細化的參數控制,其輸出質量還將有明顯的提升空間。據此,我們的判斷是,當前階段的AI生成音樂已經能夠滿足不同商用場景的基礎需求,為游戲、短視頻或廣告等提供BGM。
AI正在重塑商業音樂工作流
在商用音樂領域,AI已經開始對傳統生產模式產生沖擊。
早在五年前,一些國外功能性音樂公司就開始嘗試使用AI生成音樂。到2024年,數據顯示,31%的廣告公司在營銷活動中使用AI生成音樂,27%的游戲音頻設計師使用AI音樂生成工具,19%的YouTube創作者使用AI生成背景音樂。
廣告、游戲和視頻內容對音樂的需求通常可量化程度高,制作流程也相對標準化,這使其成為AI音樂最容易進入的領域。
![]()
在這些場景中,AI的優勢并不在于創意表達,而在于穩定的規模化生成能力。當AI模型能夠持續輸出結構完整、風格穩定的音樂內容時,就不再只是創作輔助工具,而開始具有改變行業鏈條的能力。
以影視配樂為例,傳統配樂制作通常是一個成本高、周期長的工業流程。一分鐘頂級電影配樂的制作成本往往在2萬美元以上,如果邀請一線配樂師,整部電影的配樂預算可能達到數百萬美元,同時還需要樂團錄制、專業錄音棚以及復雜的后期制作。
相比之下,AI一分鐘即可生成音樂,并且可以隨時調整結構、情緒或配器,價格也非常低廉,這種效率和成本差距對于需要大量音樂內容的行業來說具有明顯吸引力。
工作流程的變化已經在不同內容行業中出現,在游戲開發中,一些團隊已經開始嘗試使用AI生成動態配樂,使音樂能夠隨游戲劇情實時變化;影視行業也在探索AI在內容制作中的可能性,華納和迪士尼等公司都在嘗試將AI工具引入影視制作流程。
在國內,一些AIGC內容項目開始嘗試完整的AI創作鏈路,并走出國界。例如基于經典香港電影IP開發的AIGC漫劇《花好月圓之狐妃嫁到》,就使用MiniMax的全模態模型完成了從視頻生成、語音配音到音樂創作的全流程制作,其中,Music 02音樂模型為作品生成了專屬OST。
AI工具正在從不同方向進入內容生產的核心環節,被改變的將不僅是某一類內容的創作方式,而是整個內容產業的工作流程,AI與人類在其中的角色也將隨之重新分配。
AI負責“標準”,人類回歸“非標”
從某種意義上說,AI音樂大模型創造了一個新角色,全能的AI作曲家。
過去,AI音樂更多被視為創作輔助工具,例如生成靈感、制作Demo或提供簡單的編曲素材。但隨著模型能力的不斷進步,AI已經能夠獨立完成完整音樂的生成,并直接進入廣告、游戲、視頻等商業內容生產流程。
當AI開始具備完整的音樂創作能力時,它也就成為了一種新的“創作者”。
![]()
在這一背景下,音樂行業中大量高度標準化的生產環節,將首先受到沖擊。從音樂庫制作、初級編曲與混音,到基礎音效和采樣生成,這些依賴固定模式與穩定風格輸出的工作,正是AI發揮效率優勢的地方。
MiniMax音樂模型所體現的正是這樣一個趨勢,AI已經可以生成符合專業場景需求的成品音樂,并因此將接管傳統的標準化崗位。
但這一變化并不只是簡單的技術威脅,更像是一場審美工程的“騰籠換鳥”,AI接管標準化工序的同時,人類創作者也將轉向具有更高價值的非標準化工作環節,例如風格設計、情緒深度控制以及跨媒介的藝術整合,并在內容巨量輸出的時代,依靠個人審美扮演一個“策展人”的角色。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.