当前位置:首页  音频新闻  新闻资讯  软件新闻音频正文

MusicLM:谷歌的新人工智能工具,可以将文本变成音乐

发布时间:01-30 编辑:音频应用

谷歌最近发布了一种新的人工智能 (AI) 工具,可以根据文本提示创建任何类型的音乐,甚至可以将吹口哨或哼唱的旋律转变成其他乐器。

谷歌最近发布了一种新的人工智能 (AI) 工具,可以根据文本提示创建任何类型的音乐,甚至可以将吹口哨或哼唱的旋律转变成其他乐器。


Github 的研究表明,被称为 MusicLM 的技术是一种文本到音乐的创作系统。它通过检查书面语言并计算出作品的大小和复杂程度来运作。MusicLM-Googles-new-AI-tool-that-can-turn-text-into-music.jpg



除了将哼唱的曲调转换成各种乐器外,这种 AI 算法还可以将文本输入转换成几秒钟甚至几分钟的音乐。


“我们展示了 MusicLM,这是一种使用文本描述的模型,例如“由扭曲的吉他即兴重复段支持的平静的小提琴旋律”来创作高保真音乐。据该公司称,“MusicLM 以 24 kHz 的频率生成音乐,并在几分钟内保持一致”,并且“将条件音乐生成的过程转化为分层的序列到序列建模任务。”


谷歌的人工智能创造了 5 分钟的旋律

示例包括 30 秒的剪辑和 5 分钟长的听起来像歌曲的片段。它们是一段长的描述的结果,当说明更清晰时,音乐会更好。此外,示例中还包括流派、氛围,甚至特定乐器。


“一系列文本提示用于生成音频,研究人员表示,这会影响模型如何继续从先前的字幕中导出的语义标记。”


故事模式


还有一个“故事模式”演示,其中基本上为模型提供了一些文本输入和需要制作的每种音乐的时间限制。


据研究人员称,实验表明 MusicLM 在音频质量和对文本描述的遵守方面都优于以前的系统。


此外,研究人员证明,MusicLM 可以根据文本标题的风格转换口哨和哼唱的旋律,从而同时以旋律和文本为条件。


声明:该文观点仅代表作者本人,音频应用信息发布平台,官网仅提供信息存储空间服务。
最新音频交流