当前位置:首页电脑音频行情快递行情新闻音频正文

从唱歌到演出，AIGC与音频生成技术会颠覆艺人的生存模式吗？｜PRO之声

发布时间：04-10 编辑：中国音乐财经

AIGC（人工智能生成音乐）作为一种新兴的音乐创作方式，正在逐渐改变音乐产业的格局。(回顾：Suno V3的地震余波：平台、厂牌和产业链何去何从？｜对谈陈戈陈华戈非卢中强和葫芦文化制作人）

在这一背景下，音频生成领域也呈现出早期阶段的活力与巨大发展潜力。音频生成领域虽然起步较晚，但其发展速度迅猛。声音作为音乐创作的基石，具有强烈的“人身”属性。在音乐作品中，声音不仅是传递情感的载体，更是歌手个性魅力的体现。声音的独特性使得音乐作品具有鲜明的个人风格，成为歌手赖以生存的根本。

从版权到创作，从唱歌到演出，AIGC音乐的发展是否会颠覆艺人行业的生存方式？随着AIGC技术的发展，未来音乐行业将呈现出更大的不确定性和更多的可能性，身处音乐行业里的从业者如何看待AI落地应用场景所带来的机会与挑战？

最近，音乐财经与PRO会员朋友们一起在线下探讨了Suno与AIGC音乐发展的话题，以下是现场交流的极简版，供您参考。

641.webp.jpg

电影配乐/作曲 Zoe

我是一个独立作曲者，从高中开始就在音乐学院学习作曲，本科经常跑电影学院去和朋友一起玩文艺片的配乐，之后研究生继续去美国学习老本行。在美国这两年给我最大的启发就是，从附中到本科，这八年时间，大部分学习的音乐作品，一直停留在西方20世纪“当时比较时髦”的音乐文化，觉得这就是新音乐。但去国外听了很多音乐会，接触了更多实验音乐和前卫艺术，才真正有了“contemporary”这个概念。如果只是单纯的学习传统的科班知识，根本就赶不上这个时代的变化了。

身边一些朋友，有时候会局限在自己的小圈子里，象牙塔成为舒适圈，停在里面走不出去。尤其在面临职业选择的时候，很容易“高不成、低不就”。反观现在抖音、快手上的流水线音乐，从赚钱的角度来看，其实可以产生很好的收益，但对一些科班出身的人，就很难放下身段。

Suno的出现，我觉得是一个挺好的工具，因为如何定义一个好的音乐人，或者作曲家？是通过审美、眼光和品味，包括多年的经验与知识的积累，而Suno的诞生能淘汰掉一批甚至可能连和弦都不太能明白的人。这些人现在反而比真正在做音乐的人更赚钱，所以我觉得这种业态并不太公平。

我试用了Suno很多次，它基本可以代替“生产线”上的音乐，除了我觉得中文、声调、咬字和一些字句划分上的问题，还做不到那么强，但对于生成其它语种的歌曲都蛮不错的。

说到赚钱，Suno最有利的一面是降低成本，提高了效率。例如，之前接广告，会与版权音乐公司合作进行授权。那么现在这个环节大概率是不需要了，个人就可以是一个音乐库，随时都可以生成小样发给客户。有一些广告商，为什么有一两百万的音乐预算，也不会轻易尝试去做原创？总的来说就是与其试错，花费不必要的时间，不如就花重金够买现有的欧美大流行版权。现在Suno出现了，其实能够更好的帮助独立音乐工作者，效率的提高，至少能帮助你赢得与客户讨论创意的时间。

成本问题很重要，客户需要考虑预算，你作为团队的甲方，规划各个环节的预算是件很麻烦的事。我经历过很多不同的报价，我发现这里面水很深。与商业项目相关的，有些高报价的和淘宝几百块的没什么区别，都是一个模版套路出活。我甚至还在某书上刷到了12.8元的编曲，我就觉得这个行业真的是挺混沌状态。与其这样，不如借助AI加速这个行业的洗牌。

工具的出现必然会创造更多的价值，AI提供了新的生产方式，除了节省开支，进行更好的价值分配，我觉得对于个人价值的体现也会有更好的促进，同样都用AI，为什么有的人就能更甚一筹？这就关乎于个人的经验、音乐审美与知识积累。

Suno有时候还会给我意外的惊喜。我之前尝试生成过一个Boogie-woogie的音乐，Suno自己帮我加了一段break，很吸引我的耳朵，我就觉得，嗯，我都没想到，它想到了。

有些时候，输入完prompt等待生成的过程，甚至有一种开盲盒的期待感。所以我认为完全没必要去纠结会不会淘汰人类，你想把它使用很好，首先你就得把自己提升的更好，你用它生成的产物才会更准确。它在鞭策你，让你向上提升，这个过程中把它当成玩具去玩就好。

索尼音乐 A&R Tracy

我来自唱片公司，平时的工作主要是做艺人，也负责OST这一块的项目。

今天的主题是探讨Suno如何重塑音乐行业。对于我来说，一开始AI图片生成我也都有关注，我知道AIGC音乐生成的软件特别强大，这些玩法和模型，我都有去试过，我当时的感觉是如果用AI去好好做一个音乐，可能对音乐有审美的人的要求，就还是有门槛的。

虽然我对AI没有那么深的研究，但我感觉如果要再提升一个层次，最终还是要靠人的能力，也就是使用AI工具的这帮人如何把作品更好地优化。

现在AI已经可以唱了，再发展发展，其实未来平台也会把这些歌手的声音采集放进去。先不说侵权与否的问题，哪怕不采集一个很有名的歌手，就对一个唱得很好的普通歌手做声音采样，足够精细后出来的AI作品也会挺好听的，有情感、曲线和起伏，呼吸甚至都很明显。

至于AI会不会取代人？其实就拿艺人来讲好了，我们刚才聊到Taylor Swift和个人IP的打造，因为大家之所以会崇拜明星或者是会追星，会去喜欢一个IP，当成一个信仰，其实不光是对方唱歌好听，写歌好听，还有个人魅力的原因。比如喜欢周深的粉丝，也不单纯只是因为他是天籁之音，还有他这个人所有魅力的加持。

作为音乐行业艺人的角度来讲，还是有不可判断和不可预知性在里面，这也是最有魅力的部分，AI可以有足够“库”的分析，建模可以建得足够好，但人的个性和一些现场表现，是没有办法被算出来的东西。比如我们经常会录音，有的歌手我就知道他会唱成什么样子，大致有一个判断，但经常在录音棚里会给到一些惊喜，哪怕在特定的环境当中会被认为是有瑕疵的，但也会被保留下来，这个才是魅力的一部分。

所以我觉得AI哪怕太好了，运转得非常精准、无可挑剔，反而会让你望而生畏，人类的瑕疵和不完美也是魅力的组成，短期内至少不会颠覆音乐人。

作为AI工具，现在会是一个助手。作为A&R的岗位，因为本身我们在做一个艺人的服务，不管是专辑也好，还是单曲也好，你做规划的时候一定是要有足够的准备，原来是靠我们从库里面去找，或者靠我们自己的经验，现在有AI了，可以生成一个去感觉，有的时候也会让我们觉得眼前一亮。另外一个功能我认为是在编曲上给到我们灵感的提示。

在信息处理上，我们人的脑子肯定比AI要弱很多，AI起到的是信息集中处理的功能，创造性的东西还是要靠人。

梦梦演出行业

我在演出场馆工作，做一些线下演唱会的活动。虽然专业不是音乐相关，但是我对音乐行业很感兴趣。

我属于大众用户，有一点灵感，想做一个类型的音乐，但是我完全不懂，做不出来，这时候就可以让Suno帮我做。所以对我这样的普通爱好者来讲，AI工具就是帮我去实现梦想、实现想法的一个工具。

但是我也觉得有一个问题，就是它会更加需要使用者对音乐整体的感觉。就像我们在工作中，领导交给我们一件事，你具体去执行，那我们让Suno去做也是这样的感觉，一定要有一个明确的想法和指令，不然的话，做出来也是一团糟，AI自己可能不太知道要出来的是一个什么样的成品，也是在指令下去试，不断地去尝试和打造出来。我觉得这对于我们人类来说，肯定要求会更高了。

但是我还有一个疑问，为什么AI一定要去代替人类呢？

当然从商业逻辑上来说，我们花大价钱去研发出来这个技术，它一定能更省钱代替一些人力成本。但是从大面上说，人归人，AI归AI，是否让AI去探索一些人类达不到的领域？我觉得这是比较有趣的东西，就像刚才Tracy老师说了，人类的独特之处，在于人类会有瑕疵，AI不会。

还有什么是人类和AI不同的点吗？我认为是思维模式不一样，虽然我不知道AI的思维和意识是怎么诞生的，虽然AI是人类造出来的，但这根本就是两个物种，那我们能不能各干各的，去探索各自的极限？

因为我现在入行才两年多时间，本身经验比较少，就不发表更多的意见了，我觉得AI工具在演出行业的应用，比如虚拟歌手演唱会的探索等，也采用大量的AI技术。因为我自己本身也追星，对于现场演出来说，我认为还是看“真人”才是更重要的吸引力。

佳懿，歌手/商务

我一直学唱歌，毕业后给艺人做声乐指导，现在转行在一家公司做商务。

因为我本人是学唱歌出身，AI对于我这样不是专业学作曲和制作的人来说，是一个非常好的工具。因为在过去，我要想弄一首作品出来还挺费精力的，毕竟不是专业学音乐制作和编曲的，所以Suno这一类AI工具诞生之后，它就大大地提升了我的工作效率。

我刚才一直在听各位老师的分享，处于学习的状态，非常受益。

刚才老师提到了虚拟歌手，因为之前会经常看到一些项目，比如找真人来录制AI项目的声音，就我本人而言，其实是很抗拒的，因为不希望自己的人声被提前采集。对于一个处于发展期的歌手来说，AI歌声这种事情还是会对自己事业产生一定的负面影响。

我不知道各位是怎么看待这个问题的？当平台找一些歌手去录制他们的声音，应用到各种场景，可以理解成被采集的声控，你的声音会被传播到所有地方，但没有人会知道你是谁。相当于大家可能记住了你的声音，但并不知道你真人是谁，对于一个想要一直做歌手的人来说，想一直在音乐行业发展，我会认为这种方式并不友好。

虚拟艺人前两年特别火，我也做过一段时间，我朋友的公司做这个方向。我给他们做了一段时间的音乐指导，因为虚拟艺人也要做歌。

洛天依和初音未来的声音属于它自己软件库里的声库，故意做得没有那么象真人，面向二次元群体。而前两年特别流行超写实艺人，做得很逼真，特别写实，采集的也是真人的声音。这个虚拟艺人后面有中之人穿“动捕”设备直播，互动是平等的，主打真诚，也有人设，比如歌就是唱得好，创作能力强等。（回顾：虚拟偶像生意新进展：全球挑选，跨国布局）

但是，我其实完全没有想通虚拟艺人行业的逻辑。砸钱吧，给到实际歌手的费用又不多。其实对歌手来说，去做虚拟艺人的歌就是当一个活儿在干，公司大部分钱是花在了形象和推广上。而且，这些形象既没有很强的内核，内容又不够好......说实话，这个问题困惑我很久了，真的不理解花这么钱和资源做这个玩意是为什么？

小葛音乐人/商务

我入行快十年了，曾经在AI音乐科技公司干过几年，在版权音乐公司干过几年，也算比较了解一些内幕。

我之前做AI音乐数据模型这一类，15年到18年期间，我跟我老师罗俊霖一起在做AI音乐，希望通过大数据引领AI技术革新改变音乐创作的形式。他其实在2005年就开始研究AI作曲了，这个模型在2008年的时候就已经在写了，比现在版权市场上的很多歌写得要好太多了，但就是一直没有推广。15年到16年，我们正式开始做公司这个事。

对于AI音乐，我先说结论，当时的技术水平还达不到真正的人工智能音乐，因为它的逻辑完全不是人做音乐的关系，AI音乐的逻辑相当于神经元系统——把所有的分轨文件、音频文件、乐器文件都打上不同的标签，通过标签的各种组合，触发标签与标签之间嵌套的一种方式来定义音乐，所以是类似于组合形式的模型。

在这个过程中，服务器承载量极度消耗算力，这个问题很大，一般的服务器带不起来。我们当时创业失败面临的最大问题就是带不动服务器，所以生成速度很慢，等十分钟才出来，那谁会用？所以在18年这个期间，我们算是国内最早一批做AI音乐的公司。

算力的问题对于AI来说一直存在，虽然谈过很多融资，但是平台投的钱太少了，我们知道靠这一点钱根本不可能实现目标。因为我们算过一个成本，天使轮就需要2亿的资金，才能烧得动这么大的数据模型库。你的数据库做得越好，出来的音乐就越好，我们在那个阶段不可能融到那么多钱来烧，国内撑死融两千万，这笔钱对我们来说就只是用于程序开发阶段。

这是当时我们遇到的困难，AI模型和做音乐的思维完全不一样，可能听起来做AI会更加准确，做出来会更好听，但实际上不是人创作的思维，也不是“一生二”那种变的思维。

所以，我觉得未来AI不会淘汰掉音乐领域的人。尤其是不会淘汰市场上口碑好、需求理解能力强的音乐人。因为越到后面，对人的这种需求就会越来越明显，这种能力类似于理解能力强，能不能get到别人的心很重要。

此外，创意很强的人，擅长做决策的人也不会被淘汰，演出类也不会，因为更加注重现场的表达和情绪感染能力。而且，真正的作曲家和艺术家不会被淘汰，我觉得厂牌以后签人的逻辑也会完全不同，就变成纯粹签艺术家的逻辑了。

从平台的视角去看的话，假如说我们设想一种极端情况，比如AI音乐的播放数据对业务的收益贡献，要远远好于人类作曲家的音乐。那平台方有什么动力去给音乐人分这么多钱呢？这值得思考。

汪石唱片公司 A&R

我在三大做A&R，一直在音乐行业工作，对AI这部分我不是那么了解，今天听了很多分享，也学到很多。我蛮赞同Tracy的说法，它还是一个辅助性的工具，并不能改变我们整个的创意流程，或者是我们跟艺人的工作模式，至少在短期内看不会改变。

刚才聊到数据库，我也蛮有感受的，就好像我们当年做音乐制作，音色不断在升级，音色包不断扩大，越来越精细。在某种程度上讲跟我们音乐制作的逻辑是一样的，我积累这些人声的素材，采样各种人声的素材，把这个数据库做得越来越完整，就可以生成一个更好的素材，所以底层逻辑没有变。

十年前，我关注到初音未来，那个时候是用Vocal的软件来做，现在实际上是一个人声的采样，用我们音频后期修音卖的方式，去给这个声音的采样画上表情，然后变成一个来自于未来的人声。我的想法比较单纯，Suno这些工具的出现把这个过程自动化了，变快了，以一套算法代替了手动“画”的过程。

现在播放器的版权价值被稀释，上线的歌曲数量多，对我们来说是一个巨大的挑战，尤其是我们制作一首歌的成本那么高，版权收入那么低，我们怎么去评价这个东西呢？就很难，站在唱片公司的角度，我们很多时候更在意作品、品质和艺人的综合发展，实际上，唱片公司现在制作专辑的预算也是逐年递减的。

如果按照现在编曲可以退休的趋势，那我们真的会拥抱这个工具，以低成本的方式，基于自身业务运作的逻辑上去使用它，从这个角度来看，AI能给到A&R一些帮助。

Henry 技术/音乐爱好者

我是一个IT从业者，音乐是我的兴趣爱好。我最近刚从公司离职，现在转成自由职业，给一些公司做AI方面的顾问服务。

我是80后，感觉在市场上已经属于比较暮气沉沉的一波人了，但我感觉和大多数同龄人不一样，对音乐的兴趣还是比较活跃。我以前也组过乐队，一直对音乐和技术产业的交叉发展感兴趣。

因为我一直挺关注AI的，去年AI孙燕姿很火，大家一直在探讨AI在声音方面的突破。Suno这家公司其实已经默默做了两年多，v2版本就已经挺惊艳了。之前我在网上看各种文章，也看B站和YouTube的视频解说，大家的讨论各种各样。我看大多数其实都是捕风捉影，是臆想的。顺着Suno公司的历史和转变，可能会有不一样的理解。

本来Suno一开始跟现在市面上的很多的AI公司一样，他们最早根本也没想到生成音乐的主意，而是主打文字合成语音。后来被客户问到能不能AI生成音乐，他们觉得能，投资人也愿意给足够的钱，那就做吧。这个团队最早是做声学的，最早的职业生涯是在一家公司里替公司把语音电话录下来，给转成文字。因为客户可能来自各种国家、各种语言、出现各种不清楚的声音，客服人员根本都听不清楚。总之，声音识别和反过来文字生成声音是他们一直专攻的方向。

他们的投资人其实非常清楚做这个领域的尝试会与音乐行业为敌，也会有许多随之而来的法律问题，但是因为看好这个团队，还是投了，原因也很简单，投资人跟音乐行业没有什么利益交集。

Suno就是这么一个草根产品，整个公司到现在不过十几个人，但它做到v2的效果挺好的，后来微软给了很多钱内置到微软的copilot服务里面，微软现在是最大的金主。但是他们对商业模式其实并没有什么设计，跟很多AI公司一样，先做出来再看市场。所以很多人以为的“Suno的商业模式blah blah”其实并不准确。

因为我是搞技术出身，很早就在关注他们的原理，我追踪了挺久，没见过他们有任何的披露。但是侧面从各种访谈里能看出来肯定是基于“频谱”。这意味着，它实际上是根据频率看图，一个声音构成一个频谱图，从技术上讲是图片识别，跟音乐没关系。但是它比从前的音乐生成技术革新的一点在于它使用了transformer和diffusion技术，这也是这一轮AI革新带来的新技术。

但是它原始训练的库用的是谁的呢？他们无论如何也不肯披露，我推测肯定AI训练的过程中毫无疑问有这种未经授权的训练，但是因为生成的歌曲你又看不出来，或者没法证明，实际上很可能所有公开播放的歌曲都被投喂过。因为Suno不像别的公司模型都开源了，所以人都可以在那上面继续训练，喂进去的什么样奇怪的东西都有。

目前看，Suno比较可控的一点是规避了真人，比如你不可能让它直接生成一首薛之谦风格的歌曲，但凡是人名，或者有名的音乐明星，都在训练的时候就故意屏蔽了，你很难抓到他的把柄。但是你不知道怎么仍然会触发某个明星的风格，只不过这很难作为证据。

从Suno自己多次表达的出发点，他们是想降低音乐制作的门槛，让普通用户有一种心理满足，做属于自己的音乐，带来一种情绪价值。但在商业上，不管2C还是2B，因为尚不明确的法律问题，我认为至少现在还是很难有明显的商业模式。