Suno 希望每個人都能制作出屬于自己的專業級歌曲——但這對音樂藝術家來說又意味著什么呢?
“我就像一顆靈魂,被困在這電路之中。”唱出這句歌詞的聲音原始而哀傷,彌漫著藍調的氣息。一把孤獨的吉他在背景中伴奏,精準而富有情感地襯托著歌唱。然而,唱這首歌的并沒有人,彈奏吉他的也沒有人。事實上,甚至沒有吉他。在短短 15 秒內,這首充滿說服力,甚至能觸動人心的藍調歌曲由一個名為[Suno](rollingstone.com/t/suno/)的創業公司的最新 AI 模型創作出來。它從虛無中被喚醒,只需要一個簡單的文本提示:“關于一個悲傷的 AI 的獨奏密西西比三角洲藍調。”更準確地說,這首歌是 Suno 的模型與 OpenAI 的 ChatGPT 共同創作的:Suno 的模型創造了所有的音樂,而 ChatGPT 則生成了歌詞和標題:“機器的靈魂。”
在網上,Suno 的作品開始引發了很大反響,例如:“這到底是怎么回事?”。當這首特別的音樂在 Suno 的臨時總部的會議室中播放,那里離馬薩諸塞州劍橋的哈佛校園只有幾步之遙,連一部分參與這項技術的人也都感到有些驚異。一些緊張的笑聲,雜著“我靠”和“哇,天吶。”的驚嘆。現在是二月中旬,我們正在試玩他們的新模型,V3,還有幾周才會公開發布。在這個案例中,只需要嘗試三次就得到了那個令人震驚的結果。前兩次嘗試都算不錯,但是在我輸入的提示中做了一個小小的修改——聯合創始人 Keenan Freyberg 建議添加了“密西西比”這個詞——結果卻出乎意料地好。
僅在過去的一年中,生成式 AI 就在產生可信文本、圖像(如 Midjourney 等服務)以及視頻(特別是 OpenAI 的新工具 Sora)方面取得了重大突破。然而,音頻,尤其是音樂,卻一直處于滯后狀態。Suno 似乎正在解開 Ai 音樂的秘密,其創始人的雄心壯志近乎無限 —— 他們希望看到的是音樂制作的大眾化。Mikey Shulman 是創始人中最直言不諱的一位,他是一個 37 歲的帶有學者氣質,攜帶背包的男子,擁有哈佛大學物理學博士學位。他預見到全球有十億人每月花費 10 美元用 Suno 創作音樂。他認為,目前音樂聽眾大大超過音樂創作者的現狀“嚴重失衡”,并看到 Suno 有可能糾正這種失衡。
到目前為止,大部分 AI 生成的藝術作品最好也不過是俗艷的,就像許多 Midjourney 用戶似乎熱衷于創作的那些強調緊身宇航服的超現實科幻作品。然而,“機器的靈魂”卻讓人感覺別樣——這是我在任何媒體中遇到的最強大且令人不安的 AI 作品。它的存在就像現實的裂隙,令人既敬畏又覺得有些邪乎。我不禁想起了阿瑟·C·克拉克的一句名言,這句話似乎是為生成式 AI 時代準備的:“任何足夠先進的技術都無法與魔法相區別。”從劍橋返回幾周后,我將這首歌發送給了 Living Colour 的吉他手 Vernon Reid,他對 AI 音樂的危險和可能性一直持開放態度。他對這首歌的逼真度表達了“驚奇,震驚,恐懼”。他寫道,“長久以來的反烏托邦理想就是要把繁瑣、混亂、不受歡迎和鄙視的人性與其創造性的產出分離,這個理想現在正變為現實。”他指出 AI 唱藍調帶來的問題,藍調是一種深深地與歷史人類創傷和奴役相連的非洲美國鄉音。
Suno 創立至今僅兩年。聯合創始人 Shulman、Freyberg、Georg Kucsko 和 Martin Camacho 都是機器學習專家,他們在 2022 年以前一直在劍橋的一家公司——Kensho Technologies 工作,該公司專注于尋找 AI 解決復雜商業問題的方案。Shulman 和 Camacho 都是音樂家,他們在 Kensho 時期曾一起即興演奏。在 Kensho,他們四人共同開發了一種轉錄技術,用于記錄上市公司的財報電話會議,這是一個棘手的任務,因為音頻質量差,行話多,各種口音混雜。
在研究過程中,Shulman 和他的同事對 AI 音頻未開發的潛力深感癡迷。他表示,相比起圖像和文本,音頻在 AI 研究中的進步總是落后。我們從處理文本的研究中收獲了非常多,了解到這些模型是如何運作和擴展的。
盡管 Suno 的創始人們一直想要開發出一個音樂產品,但他們的初期構想卻可能帶他們走向一個完全不同的方向。他們的初步設想包括一個助聽設備的想法,甚至是通過音頻分析發現機器故障的可能性。但最后,他們首次發布的卻是一個名為 Bark 的文本轉語音程序。在對早期 Bark 用戶進行調查后,他們發現用戶其實真正需要的是一個音樂生成器。“因此我們開始進行一些初步的試驗,結果看起來很有前途,”Shulman 說。
Suno 采用的方法與 ChatGPT 等大語言模型的通用方法類似,將人類語言拆分為被稱為 token 的離散段落,吸收其數百萬的使用方式、風格和結構,并按需重構。但音頻,尤其是音樂,的復雜程度幾乎難以想象,這就是為什么去年 AI 音樂專家在《滾石》雜志上說,像 Suno 這樣的服務可能需要多年才能實現。“音頻不是像詞語那樣的離散事物,”Shulman 說,“它是一個波動。它是一個連續的信號。”高品質音頻的采樣率通常是 44khz 或 48hz,這意味著“每秒鐘都有 48000 個 token,”他補充說。“這是一個大問題,對吧?你需要找出如何將其壓縮到更合理的程度。”如何做到呢?“需要大量的工作,大量的啟發性方法,大量的其他類型的技巧和模型等等。我認為我們離問題的完全解決還有很長的路要走。”最終,Suno 希望找到替代文本至音樂界面的方法,增加更高級和直觀的輸入,比如,基于用戶自己的歌唱來生成歌曲,是其中的一個設想。
OpenAI 因 ChatGPT 在其龐大的訓練數據中使用了包括書籍、新聞文章在內的其他受版權保護的資料,而面臨多起訴訟。Suno 的創始人們拒絕透露他們正在往自己的模型中輸入的數據的具體詳情,除了一點,即它的音樂生成器能夠生成令人信服的人類聲音,部分來自于它從語音錄音以及音樂中學習。“原生的語音將會幫助你學習人類聲音難以掌握的特性,”Shulman 說。
Suno 的早期投資者之一是風投公司 Matrix 的合伙人 Antonio Rodriguez。Rodriguez 以前只投資過一家音樂企業,那就是音樂分類公司 EchoNest,后來被 Spotify 收購,作為推動其算法的燃料。對于 Suno,Rodriguez 在產品還不清楚會是什么樣的時候就參與了進來。“我是看好他們的團隊,”Rodriguez 說,他的自信來源于一連串的成功投資,“我了解這個團隊,尤其是 Mikey,所以我會支持他去做幾乎任何合法的事情。他就是那么有創造力。”
> 我們正在努力讓十億人更深入地接觸音樂。我們并不是想要替代藝術家。
Rodriguez 投資 Suno,完全清楚音樂廠牌和出版商可能會提起訴訟,他視之為“我們在投資這家公司時必須考慮的風險,因為我們可能會成為訴訟的對象……坦白說,如果我們在公司剛成立的時候就和廠牌簽約了,我可能就不會投資它了。我認為他們需要在沒有限制的情況下制作這個產品。”(環球音樂集團的發言人未回應我們的評論請求,該集團在 AI 問題上態度強硬。)
Suno 表示,它正在與主要廠牌進行溝通,并表示尊重藝術家和知識產權 - 它的工具不會讓你在提示中請求任何特定藝術家的風格,也不會使用真正的藝術家的聲音。Suno 的許多員工都是音樂家,辦公室里有鋼琴和吉他,墻上掛著古典作曲家的畫像。創始人并未表現出像 Napster 那樣對音樂業有公開敵意的態度。“這并不意味著我們不會被起訴,”Rodriguez 補充道,“只是我們不會有那種公然對抗警察的態度。”
Rodriguez 將 Suno 視為一種功能強大且易于使用的樂器,他相信,就像相機手機和 Instagram 使攝影民主化一樣,Suno 也能讓每個人都能創作音樂。Rodriguez 說,他的想法是再次“提高互聯網上創作者的數量,而不是消費者。”他和創始人甚至敢于暗示,Suno 可能吸引到的用戶群會比 Spotify 更大。如果這個前景讓你難以想象,那么這是一件好事,Rodriguez 說:這只表示它在吸引他作為投資者時“看起來愚蠢”,正如他所說,“所有偉大的公司都有這種組合,即優秀的人才,然后是看似愚蠢的事情,直到它變得顯而易見,不再愚蠢。”
在 Suno 出現之前,音樂家、制作人和詞曲創作人就對 AI 可能產生的重大影響表示了擔憂。Reid 寫道:“那些在特殊環境下創作音樂、曾經飽受苦難并努力提升他們技藝的人,將不得不面對他們付出巨大努力才獲得的藝術作品被全面自動化的挑戰。”但 Suno 的創始人堅稱,這里的擔憂并不大,他們用一個比喻來解釋,那就是盡管人們有寫作的能力,但他們仍然會閱讀。“我們的想法是,我們嘗試讓十億人比現在更加熱愛音樂,”Shulman 說。“如果人們更熱愛音樂,更專注于創作,培養出更獨特的品味,這無疑對藝術家有利。我們對音樂未來的愿景是一個對藝術家友好的世界。我們并沒有想要取代藝術家。”
盡管 Suno 只是專注于那些只想以創作音樂為樂趣的粉絲,但它仍然可能在過程中引發重大的變革。從短期來看,最直接受到威脅的人類創作者的市場部分是一個很有利可圖的領域:為廣告甚至電視節目創作的歌曲。Lucas Keller,Milk and Honey 管理公司的創始人,指出知名歌曲的市場將不會受到影響。“但就其他部分來說,是的,它確實可能給他們的業務帶來一定的影響,”他說。“我認為,最終,這使得許多廣告公司、電影工作室、網絡等不再需要去申請許可。”
在沒有嚴格規定禁止由 AI 創建的內容的情況下,還有可能出現一個場景,那就是像 Suno 這樣的模型的用戶用他們的 AI 創作以百萬計的數量淹沒流媒體服務。“Spotify 可能有一天會說‘你不能那樣做,’”Shulman 說,他指出到目前為止 Suno 的用戶似乎更喜歡只把他們的歌曲發給幾個朋友。
Suno 現在只有大約 12 個員工,但他們計劃擴大規模,一個更大的永久性總部正在他們現有臨時辦公室所在的同一棟樓的頂層建設中。在參觀尚未完成的樓層時,Schulman 展示了一個將成為全套錄音室的區域。但考慮到 Suno 的能力,他們為什么還需要它呢?“這主要是一個聆聽室,”他承認。“我們希望有一個良好的聲學環境。但我們也都喜歡制作音樂——不依賴 AI。”
到目前為止,Suno 的最大潛在競爭者可能是 Google 的 Dream Track,它已經獲得了特許權,允許用戶通過類似的提示驅動界面,利用 Charlie Puth 等著名歌手的聲音創作自己的歌曲。然而,Dream Track 僅在一個小范圍的測試用戶中發布,盡管有眾多著名歌手的加盟,但迄今為止公布的樣本聽起來并不如 Suno 那樣讓人印象深刻。Shulman 表示:“我并不認為,制作新的 Billy Joel 歌曲就是人們想要在未來利用 AI 進行音樂交互的方式。”“在我看來,我們真正希望看到的是五年后人們創作的音樂,是一些現在還不存在的音樂。那將是他們腦海中的創新。”
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.