设计达人

爱设计，爱分享。

AI绘画教程 » Stable Audio：用AI轻松创作高品质音乐的利器

Stable Audio：用AI轻松创作高品质音乐的利器

9 月 21, 2023 发表于: AI绘画教程. 评论

Sponsor

Stable Diffusion 和 StableLM 等开源 AI 工具和模型之王 Stability AI 推出了 Stable Audio，这是其首款用于音乐和声音生成的 AI 产品。预示着音乐产业即将迎来一场革命。Stable Audio 是一款可以从头开始生成音乐的人工智能工具，您只需要提供一些简单的指令，剩下的工作就能让AI来完成。

什么是 Stable Audio？

Stable Audio 是一款首创的 AI 工具，它使用生成式 AI 技术来创建高品质的音乐和音效。

要使用 Stable Audio，您只需提供描述性文本提示和所需的音频长度。例如，您可以输入一下英文就能生成后摇滚风格的 95 秒曲目。：

Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw, Epic, Sentimental, 125 BPM

Stable Audio 是寻求创建在音乐中使用的样本的音乐家的理想选择。您可以使用它来创建音效、背景音乐，甚至您自己的原创作品。

使用 Stable Audio

前往Stable Audio仪表板并注册https://stableaudio.com/generate。

然后，转到“生成音乐”仪表板开始生成您自己的音乐。

输入提示并设置持续时间。请记住，免费订阅的音频最大长度为 20 秒。

提示：在水疗大厅播放平静的冥想音乐

单击向右的小箭头按钮开始生成音频。

目前，该网站的流量很大，因此无法正常运行。一旦网站恢复并运行，我将更新这篇文章。

同时，您可以探索Stable Audio用户指南部分中提供的示例。

怎么运行的

以下是 Stable Audio 工作原理的一些关键技术细节：

Stable Audio技术背景

VAE 将立体声音频压缩为数据压缩、抗噪声和可逆有损潜在编码，与使用原始音频样本本身相比，可以更快地生成和训练。
文本编码器用于从文本提示中提取特征。然后使用这些特征来调节扩散模型。
扩散模型是基于 U-Net 的模型，它使用残差层、自注意力层和交叉注意力层的组合来对输入进行去噪并重建所需的音频。

我不会对它在后台如何工作进行很长的解释，这也挺枯燥。如果您想了解更多技术细节，请阅读Stability AI 的这篇博客。https://stability.ai/research/stable-audio-efficient-timing-latent-diffusion

此外，另一个重要信息是，Stable Audio 模型使用了超过 800,000 个音频文件的数据集，包括音乐、音效和单乐器主干。这相当于超过 19,500 小时的音频。

它要多少钱？

如果您想生成自己的音乐供个人使用，它是完全免费的。但是，如果您想将内容用于商业目的，则需要升级到 Pro 级别。以下是定价等级：

免费：20 首每月曲目，每首曲目时长不超过 45 秒。
专业版（每月 11.99 美元）：500 个每月曲目，每个曲目最多 90 秒。
企业（自定义金额）

Stable Audio定价

最后的想法

总的来说，这个新的人工智能工具给我留下了深刻的印象。音频的质量与人类专业人士创建的音频质量相当。

Stable Audio 是一个游戏规则改变者，它可能会颠覆整个音乐和音效行业。当然，一些专业音乐家可能会对它的到来感到愤怒，他们会将其视为对其生计的威胁。但我们也没有办法阻止它。

作者：灰灰 | 来源：会AI导航(id:xiaohuiai_top)

赞助商链接

赞助商链接

设计达人微信交流社区：shejidaren888

喜欢这篇文章吗？欢迎分享到你的微博、QQ群，并关注我们的微博，谢谢支持。
版权：除非注明，本站文章均为原创文章，转载请联系我们授权，否则禁止转载。

« 什么是2K显示器，2K屏的显示器有必要买吗？

淘宝AI试衣间，享受全新的试衣体验 »

{ 发表评论 }

↑

``