AI時代，音樂行業(yè)的錢會流向哪里？

2026-04-18 16:28:41　來源: 音樂先聲

山東舉報

分享至

底氣從哪來？

最近，幾件頗具象征意味的事件接連發(fā)生。

一邊是娛樂公司開始正式把AI推向臺前，哇唧唧哇發(fā)布九周年家族曲《āi ái ǎi ài》AIMV，樂華娛樂發(fā)布了首支AI驅(qū)動女團HeyDream，華納音樂推出AI偶像吳愛花，AI不再只是幕后工具，而是深入?yún)⑴c形象設定、內(nèi)容生成和運營表達。另一邊，以大頭針為代表的AI歌手在短視頻備受歡迎，AI歌曲也開始霸榜國內(nèi)音樂平臺，有人用AI換臉模仿K-pop歌手演唱逼真到讓人難辨真假，這些都放大了技術對內(nèi)容真實性邊界的沖擊。

從AI歌曲頻繁進入流量中心，到AI歌手、AI演員陸續(xù)走向臺前，一個更清晰的現(xiàn)實正在浮現(xiàn)：AI正在重塑大眾對于真實表演、真人創(chuàng)作乃至藝人存在感的基本認知。過去音樂產(chǎn)業(yè)賴以成立的那套價值判斷——誰在唱、誰在創(chuàng)作、誰在被看見——都開始被重新定義。

當技術演進的速度，已經(jīng)遠遠快過行業(yè)和用戶更新認知的節(jié)奏，一個更值得追問的問題也隨之出現(xiàn)：在AI持續(xù)改寫內(nèi)容生產(chǎn)邏輯之后，音樂產(chǎn)業(yè)真正稀缺的價值，究竟還剩下什么？

AI音樂簡史

今天談論AI音樂，大家常帶著驟然爆發(fā)的印象，仿佛它是在大模型時代才憑空出現(xiàn)的產(chǎn)物。

事實上，如果從最早的計算機作曲實驗算起，AI音樂這條線索幾乎已經(jīng)延伸了近七十年。前半程緩慢、笨拙、時斷時續(xù)，后半程在算力、數(shù)據(jù)與模型的共振中驟然加速，最終在極短時間內(nèi)完成了從邊緣實驗到產(chǎn)業(yè)現(xiàn)實的跨越。

上世紀50年代，計算機還遠未進入大眾生活，音樂與算法之間的聯(lián)結卻已經(jīng)悄然開始。1956年，洛杉磯KCOP電視臺的一檔名為《Adventure Tomorrow》（明日冒險）的科學紀錄片節(jié)目中，一位歌手對著鏡頭唱起了一首情歌，歌頌對象不是某位姑娘，而是一臺名為Datatron 205的計算機。

這首歌的真正“作曲家”，是兩位工程師Martin L. Klein和Douglas Bolitho。他們的動機非常有意思，曾說：“我們想證明，如果人類能以每小時一首歌的速度創(chuàng)作低質(zhì)量的‘流行音樂’，那么我們用一臺計算機，也能寫出同樣爛的歌，而且更快。”

這句冷幽默，放到今天看，竟有一種預言般的意味，觸及了AI音樂最早也最本質(zhì)的一層問題：機器進入音樂，并沒有從“理解美”開始，而是從拆解規(guī)則開始的。

同年，化學博士Lejaren Hiller突然意識到，作曲和化學研究，本質(zhì)上都是在嚴格的規(guī)則體系下進行創(chuàng)造性的選擇。于是，他聯(lián)合數(shù)學家Leonard Isaacson將作曲規(guī)則編寫成程序，讓ILLIAC I計算機按照指令，創(chuàng)作出一首弦樂四重奏《Illiac Suite》。

如今從歷史的角度聽《Illiac Suite》，會發(fā)現(xiàn)這個組曲集合了許多具有共同調(diào)性、但彼此封閉的器樂作品，恰恰暴露了早期計算機作曲的本質(zhì)——只能忠實地執(zhí)行預設的指令，將不同規(guī)則下的產(chǎn)物機械地并置。

幾十年后，類似的嘗試開始逐漸走出實驗室。1997年前后，美國作曲家David Cope開發(fā)的EMI（Experiments in Musical Intelligence）系統(tǒng)能夠自動模仿“類似巴赫或莫扎特風格”的音樂。甚至在一場盲聽測試里，EMI作品足以讓專業(yè)聽眾判定為巴赫真作，反倒把巴赫本人的作品打成了“拙劣偽造”。

當時圍繞EMI的爭論，如今聽來有一種驚人的熟悉感。有人認為，這根本算不上創(chuàng)作，屬于作弊；有人擔心，它會摧毀作曲家的地位，使創(chuàng)作勞動失去稀缺性；也有人堅持，機器不可能擁有靈魂，只是空洞的模仿。

三種聲音，完整預演了今天圍繞生成式AI展開的公共辯論。時代換了，模型換了，措辭換了，但問題本身并沒有變。

后來的結局也很有意思，因為當時爭議太大，David Cope直接刪除了EMI的音樂數(shù)據(jù)庫。他認為，如果音樂可以無限復制，它就會被貶值。

但歷史的吊詭之處，就在這里。

Cope試圖阻止的，恰恰成為后來三十年AI音樂公司不斷重復的技術邏輯，學習既有音樂、訓練生成系統(tǒng)，再以新的形式產(chǎn)出音樂。作為最早的AI音樂模型，它在1990年代引發(fā)的問題沒有消失，只是被更大的數(shù)據(jù)、更強的模型和更成熟的商業(yè)體系放大了。

到了2010年代，AI才真正開始觸碰現(xiàn)代音樂產(chǎn)業(yè)的應用領域。

2016年，索尼計算機科學實驗室通過學習13000份樂譜，試圖模仿披頭士的創(chuàng)作方式，創(chuàng)作了歌曲《Daddy’s Car》；2017年，美國網(wǎng)紅歌手Taryn Southern在YouTube上傳了她和AI共創(chuàng)的單曲《Break Free》，谷歌Magenta項目也證實啟動。雖然這一階段的AI音樂仍然帶著明顯的實驗屬性，但技術路徑已經(jīng)清晰，共同拉開了一個人機共創(chuàng)音樂新時代的序幕。

在過去近七十年的時間里，AI音樂的進步大多以十年、幾十年為單位，緩慢推進。真正意義上的變化，發(fā)生在最近這半年。

從2025年9月至今，隨著以Suno V5為代表的AI音樂模型的能力持續(xù)進化，短短數(shù)月之間，AI音樂幾乎完成了一次全鏈路層面的躍遷，即從以演示為主的demo形態(tài)，迅速走向可商業(yè)使用、可規(guī)模化部署，并逐步被產(chǎn)業(yè)接納的完整能力體系。

這也是為什么今天AI音樂帶給行業(yè)的震感，和過去幾十年的任何一次技術進展都不完全相同。很多時候，人類習慣先建立判斷，再面對變化，但在AI時代，變化的速度似乎讓順序被顛倒了，變化先發(fā)生，判斷只能不斷被迫修正。

AI狂飆，什么正在升值？

過去很長時間里，音樂行業(yè)建立在技術稀缺、資源主導的結構之上，一個完整作品的誕生，需要多個專業(yè)角色的協(xié)作。

我們曾在《音樂圈的第一批AI受害者出現(xiàn)了》里提到，近兩年，那些曾撐起音樂工業(yè)化生產(chǎn)的高精密專業(yè)工具，正接連上演著令人唏噓的退場與轉(zhuǎn)向。

數(shù)據(jù)顯示，2025年，使用生成式AI音樂的用戶已經(jīng)占到全體音樂創(chuàng)作者的10%，付費使用AI創(chuàng)作的人數(shù)更是直接翻了一倍；與之形成對照的，是2024到2025年，傳統(tǒng)音樂軟件的購買人數(shù)連續(xù)兩年下滑，對應的從業(yè)者收入也同步縮水。

當AI能一鍵完成編曲、錄音棚模擬、修音、混音乃至母帶處理的全流程，這些曾需要從業(yè)者熬上數(shù)年才能磨透的稀缺技能，正在飛速褪去它的稀缺光環(huán)，從入行必備的核心競爭力變成了行業(yè)通用的基礎設施。

同步在快速貶值的，還有另一類曾在行業(yè)里被奉為硬通貨的資金與人脈。

就像是幾百年前，一手好字是文人墨客的立身之本，而在電腦普及的今天，打字成了人人具備的基本能力，內(nèi)容的靈魂終究回歸到了創(chuàng)意和才華本身。

AI可以生成無數(shù)正確答案，但真正決定選擇哪一個的，是長期積累的音樂審美、清晰的創(chuàng)作語境、穩(wěn)定的現(xiàn)場能力，以及圍繞音樂建立起來的聽眾關系。這些，都會獲得越來越高的溢價。

基于以上，我們或許可以這么理解AI，它只是給音樂產(chǎn)業(yè)換了一套更高效的生產(chǎn)工具，淘汰了一批本就平庸的人和公司。

不可避免的是，從創(chuàng)作到分發(fā)、消費，從角色定義到IP打造、商業(yè)邏輯，每一個環(huán)節(jié)的邊界都在被徹底重塑。一味拍板淘汰論，多少有點顯得像冷眼旁觀的陳述了。

我們正在目睹的是，音樂產(chǎn)業(yè)不再沿著舊地圖運行，但AI不是從業(yè)者的對立面。

就像早年黑膠存儲決定了一首歌的時長，短視頻開始讓歌曲的時間越來越短，當進入AI時代，必然會衍生出全新的內(nèi)容形式和消費場景。而作品與場景之間的邊界會越來越松，音樂開始像水一樣，順著每個內(nèi)容容器的形狀流動，從而讓分發(fā)場景的邊界被無限拓寬。

與此同時，很多角色概念都會被重新定義。首先變化最大的是詞曲作者，AI作為輔助，誰更知道自己要什么，誰就更可能從工具里得到更好的結果。創(chuàng)作會成為決定內(nèi)容差異、用戶心智與商業(yè)轉(zhuǎn)化的源頭變量，利潤天花板、護城河也由此建立。

歌手這一概念也在松動。過去，稀缺嗓音、身體條件、訓練體系和舞臺人格構成核心資產(chǎn)，未來，這些依然重要，但不再是唯一通道。

無論是華納音樂推出的AI虛擬偶像“吳愛花”，還是在下沉市場爆火的AI歌手“大頭針”，都說明當音色、人設與內(nèi)容節(jié)奏可以被穩(wěn)定生產(chǎn)，至少從聽覺層面，聽眾對歌手的認知，正從“一個人”滑向“一個可持續(xù)被消費的聲音人格”。

從作品層面看，音質(zhì)、抓耳、傳唱度會成為最基本的起跑線，更多決定一首歌上限的，在于創(chuàng)作者能否基于自身的審美判斷與經(jīng)驗積累，通過AI把明確的藝術想法高效、精準地轉(zhuǎn)化為成熟作品。

這是AI也最容易被低估的一點。一旦意圖可以被低成本兌現(xiàn)，創(chuàng)作世界的競爭就不再是有沒有靈感，行業(yè)會更像一個由無數(shù)審美代理人構成的市場，技術負責完成，人的價值回到選擇。

或許，AI會終結我們過去理解音樂產(chǎn)業(yè)的很多前提。

創(chuàng)作、發(fā)現(xiàn)、消費、感動，這是音樂運作的四條底層線索，無論技術如何更迭，它們都是常數(shù)。其他一切，渠道、格式、工具、分發(fā)機制、平臺規(guī)則，只是在這些不變之上不斷重組。

音樂行業(yè)的錢，會流向哪里？

過去很長一段時間里，無論影視還是音樂行業(yè)，都大致遵循著一種相似的分配邏輯：資本掌握流量入口，入口影響收益分配，而分配進一步?jīng)Q定了誰更容易被看見。

當生成工具開始大規(guī)模降低制作門檻，這個秩序反而更陡峭了。

這也是AI時代最清醒也最不浪漫的一面。

以往內(nèi)容工業(yè)的壁壘是資金、團隊和周期，未來這個市場的壁壘會更像一種審美上的統(tǒng)治力，門檻沒有消失，它只是從物理層遷移到了心智層。這是錢會流向哪里的第一個變量。

不過，相比影視，音樂行業(yè)的利潤邏輯并不完全建立在單一超級IP的爆發(fā)上，而會更接近一種更綿長、更隱秘的收益結構。影視行業(yè)的集中觀看時刻確實會驅(qū)動影劇綜游漫等多形態(tài)IP的開發(fā)，但本質(zhì)大多仍是敘事和角色完成價值封頂，音樂則更依賴版權、聲線、人格與場景滲透，形成復利。

這種差異，本質(zhì)上也意味著音樂產(chǎn)業(yè)的盈利正在發(fā)生變化，Spotify《Loud & Clear》顯示，2017—2025年，僅在Spotify上產(chǎn)生超過1000萬美元錄音和詞曲版稅的藝術家數(shù)量增加了700%；1000美元至100萬美元各收入檔的藝人數(shù)量增幅在220%到250%之間，流媒體平臺上音樂從業(yè)者的“中產(chǎn)階層”在持續(xù)、穩(wěn)定地擴容。

有些意外的是，Spotify音樂業(yè)務全球營銷與政策負責人Sam Duboff表示，2025年，在Spotify年收入超100萬美元的藝人中，超過80%從未有歌曲進入過平臺全球日榜Top50，他們沒有爆款神曲，靠的是長期積累的穩(wěn)定粉絲群。

圍繞這一基礎，音樂產(chǎn)業(yè)正在分化出兩條并行的變現(xiàn)路徑：一條是以版權分賬為核心的分發(fā)體系，依賴平臺與內(nèi)容供給的規(guī)模化運轉(zhuǎn)；另一條則是以UGC與超級粉絲為驅(qū)動的生態(tài)體系，通過二創(chuàng)擴散、人聲授權與社群互動，放大傳播效率，并形成更高頻、更持續(xù)的價值回流。AI同時放大了它們，讓分發(fā)更集中、擴散更迅速，結構也因此變得更加極端。

因此，未來行業(yè)真正決定錢流向何處的，會流向場景滲透、資產(chǎn)掌控、心智占領、稀缺體驗四種能力，未來真正值得下注的，也是圍繞這四種核心能力展開的賽道。

第一類，是類似于影視行業(yè)中的3-5人的超級工作室（Super Studio）或創(chuàng)作小隊，在音樂行業(yè)則是更適合的超級音樂廠牌。理想狀態(tài)下，一個人具備審美判斷能力，懂詞曲創(chuàng)作、曲風把控，并洞察市場，同時構建IP敘事；一個懂編曲制作、AI音樂模型微調(diào)與音頻算法；一個人則掌握全球的內(nèi)容平臺分發(fā)規(guī)則、多語言社媒運營與粉絲社區(qū)的生命周期管理。未必規(guī)模最大，但一定擁有最穩(wěn)定的內(nèi)容方法論。

第二類，可能是最穩(wěn)定的賽道，AI版權與數(shù)據(jù)市場。圍繞傳統(tǒng)版權和AI生成內(nèi)容的版權授權，采用以及聲音、風格、數(shù)字分身所對應的新型權利，全球討論已迅速升溫。

美國版權局近兩年的系列報告，已明確將“可版權性”、“訓練使用”與“數(shù)字復制體”拆分為獨立議題；田納西州簽署的《ELVIS Act》則進一步把“聲音”納入法律保護范圍。AI音樂相關的版權已經(jīng)開始長出制度輪廓，未來內(nèi)容產(chǎn)業(yè)的一部分利潤，會從臺前明星項目，轉(zhuǎn)移到后臺的權利基礎設施。

今年3月，AI 音頻創(chuàng)業(yè)公司 ElevenLabs通過用戶分享他們聲音的 AI 生成副本，設定其使用方式，并在付費訂閱者使用時獲得收益，已向創(chuàng)作者支付超過1100萬美元，現(xiàn)在正將該模式擴展到音樂領域。

第三類，是AI音樂IP。一個成熟的AI音樂IP，通常需要同時具備四個核心要素：清晰的人設定位、持續(xù)一致的聲音與視覺體系、可延展的世界觀內(nèi)容結構，以及可反復沉淀的聽眾關系。

商業(yè)價值開發(fā)上，AI音樂IP和真人音樂IP在本質(zhì)上并沒有脫離同一套邏輯，但在內(nèi)容生產(chǎn)、形象延展、跨平臺運營和商業(yè)授權上，反而可能具備更高的可控性和可復制性。

最后一類，也是音樂產(chǎn)業(yè)最本質(zhì)、最難替代的一類，就是線下演出與現(xiàn)場體驗。

未來的線下演出，將不再只是作品的現(xiàn)場演繹，而是IP敘事的線下延伸、粉絲與IP的深度交互場域，盡管擴張速度慢、運營效率遠低于數(shù)字內(nèi)容，卻能憑借不可復制的在場感，獲得更高的長期商業(yè)溢價與抗周期價值。畢竟，越是合成AI、虛擬泛濫，越是真實在場變貴。

說到底，AI影響的更多是產(chǎn)量，在音樂幾百年的發(fā)展歷史里，記譜、十二平均律對音樂產(chǎn)業(yè)的影響，遠比今天的AI更深刻。

今天，我們再去討論AI音樂有沒有靈魂，不重要，人類如何對抗AI，也不重要，AI音樂的發(fā)展不只是技術史，它同時也是一部觀念史。

它正在倒逼整個行業(yè)重新回答，音樂里究竟什么才是最重要的。

*本文圖源網(wǎng)絡，如侵權聯(lián)系刪改

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.