音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 3666|回复: 0

[资讯] Stability AI 发布人工智能音乐生成器 Stable Audio

[复制链接]

669

积分

1

听众

23

音贝

音频应用新手发布

Rank: 3

积分
669
发表于 2023-9-15 | |阅读模式
音频应用公众号资讯免费发布推广
Stability AI 发布人工智能音乐生成器 Stable Audio
& [; D: r0 n* _! L9 g1 }7 u
2 E- s4 l( K, [2 ?. r! }8 J% mstability AI 是一家总部位于伦敦的初创公司,开发了开源图像生成人工智能模型 Stable Diffusion,该公司发布了Stable Audio ,这是一种能够使用“潜在扩散”技术创建用于商业用途的高质量音乐的工具。
8 D$ o" D) c* ^6 l- N: ~3 p
7 t0 b3 y" z" M" R" D- q就在这家人工智能初创公司开始探索生成音频并软发布其 Dance Diffusion AI 音乐工具一年后,据报道,Stability AI 面临着投资者的压力,要求为其创收产品注入超过 1 亿美元的资金。
" p; n1 N' W4 x8 a/ R3 l; L# N' X4 s) C& b; N
据彭博社最初报道,该公司已筹集了超过 1.25 亿美元的资金,最近又在 6 月份通过可转换票据筹集了 2500 万美元。此次交易预计将使该初创公司最初的 10 亿美元估值增加至 40 亿美元。
) B5 x3 a9 ~5 f( P0 A% o Gradient_1 (2).png
6 a' \" d& R. I, M怎么运行的
* k: U0 ]8 E( x& M* U0 {1 \. |$ v据TechCrunch 独家报道,Stable Audio 是由 Stability 的音频团队开发的,该团队于 4 月份正式成立,从 Dance Diffusion 中汲取灵感。; p  }2 P) b7 H8 r
( C; A/ ?0 _, ^# z
据 Stability AI 称,这款新工具是“首款用于音乐和音效生成的产品”,能够创建用于商业用途的高质量 44.1 kHz 立体声。通过利用其音频模型的潜在扩散,与其他一些生成式人工智能模型相比,它还能够生成具有更连贯和旋律效果的器乐。
. L# s5 s0 T" Q! {9 b
+ K- f7 t8 A) ?) N0 f- N) [值得注意的是,生成的音乐曲目长约 90 秒,其连贯性超出了其他人工智能工具通常生成的较短音频片段的范围。5 W, g7 q8 C' W7 [1 X8 b# }( m; {
+ s+ W6 s; g9 h* L6 y
与 Dance Diffusion(从有限的声音采样生成简短的随机音频片段)不同,Stable Audio 可以生成更长的音频 - 长达 90 秒,用户还可以利用文本提示更好地控制音乐曲目的生成和所需的长度。 - q2 L0 b  q. h3 _
) N: L+ J. p/ h
稳定音频输出背后的秘密是“潜在扩散”,这种技术类似于稳定扩散中用于生成图像的技术。该模型逐渐从起始歌曲中减去噪音,使其更接近所提供的文本描述。它在商业音乐库 AudioSparx 的帮助下,对一系列歌曲(不包括声乐曲目)进行了训练,以避免道德和版权问题。
9 i4 j$ p, p- G: q3 {; B: S" f; _  j: {. Q/ V7 \+ R
Stability AI 音频副总裁 Ed Newton-Rex 通过电子邮件告诉TechCrunch,该初创公司目前正在跨各种内容类型(或“模式”)构建“基础人工智能模型”。) R% H' o" w, l5 E2 F' G2 {" x
2 O  W1 j- F- F
他详细阐述了稳定扩散的扩展,包括语言、代码和音乐。“我们相信生成人工智能的未来是多模态的,”他解释道。
, Z, K2 v' z+ L+ X/ m3 g( W6 y% E( \6 m+ k( b; e
稳定音频目前通过网络应用程序提供,因为它不是开源的。在 Pro Tier 会员资格下,用户每月可以创建 500 首商业化曲目,最长长度为 90 秒,费用为 11.99 美元。
8 n  l( M; v4 \3 Q- i5 K% L
. I" D. n0 w) H; k1 y" Q2 C2 Z" V另一方面,免费用户每月只能播放 20 首非商业化曲目,每首曲目时长 20 秒。 5 e8 t+ Y. _( i- y! X

; u2 }0 N6 y7 h7 U( c/ }据TechCrunch 报道,Stable Audio 的服务条款还表明,Stability 可能会将用户的提示、歌曲和数据用于各种目的,包括开发未来的模型和服务。6 H7 g% o# S2 q( o; Q; _* }

- H3 _: {, \' n( q9 N版权问题
6 x. d. X. u* V5 B- w  E虽然稳定音频等生成式人工智能工具具有商业用途的潜力,但它们引起了版权和道德方面的担忧。 ; r1 z' {* X5 J3 N% m

( u2 ?6 {0 M( c虽然美国版权局(USCO)尚未发布其对人工智能生成音乐的官方立场;上个月,一位联邦法官裁定人工智能生成的音乐不能获得版权保护。
, _8 B+ B5 l1 f
; o8 b4 j) w2 i. k8 s在斯蒂芬·塞勒诉希拉·珀尔穆特和美国版权局一案中,贝丽尔·豪厄尔法官强调,“人类作者身份是版权的基本要求”,其中“公众是版权法的主要受益者”。USCO 发言人同意豪威尔法官的决定,但没有提供任何进一步评论。
3 ^) U* I9 C1 Q5 r$ e
/ F9 [/ N8 I5 g9 d8 a( A# b! f! j( C本月早些时候,USCO 拒绝向另一个涉及使用 Midjourney 的人工智能生成艺术项目提供版权保护,理由是它“不是人类创作的产物”。
6 t+ y) T' E2 V0 A7 }% k# V( m' G: H6 y- S1 L& v5 d2 n
Stability 的方法也没有考虑直接补偿艺术家在训练模型时使用他们的作品。然而,一些艺术家可以选择从训练数据集中删除他们的作品。Stability 的合作伙伴 AudioSparx 为平台上的音乐家提供收入分成,如果他们选择参加培训或为未来版本做出贡献,他们就可以从 Stable Audio 中获利。3 o  s6 Q- e1 b0 e" z3 [& O
; P5 ~$ \6 `* d# y
Stability AI 最近面临财务问题,包括延迟向员工付款和工资税,尽管该公司否认有任何此类困难。虽然该公司的目标是通过 Stable Audio 和其他人工智能模型扭转命运,但要成为生成人工智能和音乐领域的有力竞争者,它肯定面临一些挑战。
. l! q$ {5 P8 I# ^/ w" }( a  k
编者注:本文由nft now工作人员与OpenAI的GPT-3.5合作撰写。
1 K- j5 T* H: Y+ T; E  c( |! O
" h8 d5 H. l8 p+ _( t- |7 }https://stability.ai/stable-audio
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表