AI视频音频 视听创作
天工SkyMusic

音乐ChatGPT时刻来临

标签:
昆仑万维 AI 音乐生成大模型「天工 SkyMusic」即日起面向社会开启免费邀测
本轮邀测将开放 1000 个免费名额,面向行业媒体、专家、以及感兴趣的音乐从业者开放,用户可扫描文后二维码或通过网页填写申请,收到申请表后工作人员将第一时间联络回复。「天工 SkyMusic」正式版也将在 4 月 17 日随「天工 3.0」面向全社会免费开放。
采用自研类 Sora 模型架构 拥有五大优势 
「天工 SkyMusic」采用音乐音频领域类 Sora 模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过 LDM 让 Music Patches 被还原成高质量音频,使得「天工 SkyMusic」能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。

天工SkyMusic

「天工 SkyMusic」具有以下五大特点:
1. 高质量 AI 音乐
「天工 SkyMusic」能够生成 80 秒 44100Hz 采样率双声道立体声 AI 歌曲,并可根据用户输入的歌词风格生成对应歌曲风格。
2. 人声 “以假乱真”
人声合成是 AI 音乐生成中最重要、最能体现生成效果和品质的维度。「天工 SkyMusic」的 AI 人声合成能够达到业内顶尖的 SOTA 水平,中文水平极为优秀,发音清晰、无异响。其中文演唱效果更是显著好于国外产品,领先世界水平。
3. 歌词段落控制
「天工 SkyMusic」能够通过歌词来控制歌曲,让生成的歌曲可以明确分辨出不同歌词段落的情绪变化,体现出主歌和副歌、前奏和主歌的段落差异。
4多种音乐风格
「天工 SkyMusic」支持说唱、民谣、放克、古风、电子等多种音乐风格,用户在创作音乐时,可以通过参考音频制定想要的音乐风格。

相关导航

暂无评论

暂无评论...