Fish Audio是一个由开源语音技术团队创建的AI语音平台,提供文本转语音、语音定制、音色库等服务,支持中文、英语、日语等多种语言。用户可以免费使用基本功能,也可以通过API调用付费使用高级功能,享受自然、富有表现力的语音合成功能。
Fish Audio平台背后,是一个由开源SVC/TTS项目开创者组成的专业团队,他们在GitHub上的项目获得了超过70000星标的认可。Fish Audio的核心技术包括但不限于So-VITS-SVC、GPT-SoVITS、Bert-VITS2等,这些技术的结合,使得Fish Audio在语音合成领域具有显著的竞争力。

Fish Audio功能特点
✴️ 一键生成语音
Fish Audio操作简单快捷,用户只需输入文本并选择语音,即可一键生成所需的语音文件。
✴️ 免费开源
Fish Audio发布的Fish Speech等语音模型完全开源,任何人都可以免费使用和改进代码。
✴️ 多语言支持
Fish Audio能够处理多种语言的文本,支持中文、日语、英语三种主流语言,适应全球用户的语言需求。
✴️ 高质量输出
Fish Audio采用了先进的深度学习模型,语音合成技术接近人类水平,能够生成具有高度自然度和流畅性的语音。
✴️ 多种自然语音
Fish Audio提供多种自然流畅的语音声音选项,用户可以选择不同的声音模型,以生成更加自然流畅的语音。
✴️ 多种语音模型
Fish Audio支持多种不同的语音生成模型,包括VITS2、Bert-VITS2和GPT-VITS等,可以提供更多样化的语音合成效果。
✴️ 语音克隆
Fish Audio支持语音克隆功能,用户可以上传一段参考语音,通过深度学习技术实现个性化的语音克隆。
✴️ 实时性能
Fish Audio通过MQTT实时通信协议提供实时的语音合成服务,用户可以实时获取最新的语音内容,无需等待太久。
✴️ 音频文件下载
Fish Audio生成的音频文件支持下载,用户可以下载生成的音频文件,方便后续使用。
✴️ 低显存需求
Fish Audio的设计非常轻量,对显存的需求极低,仅需4GB即可运行。可以在设备资源有限的情况下也能正常运行,极大地扩展了其适用范围。
收费价格
Fish Speech作为一款免费开源的文本转语音模型,用户可以无成本地享受其基本服务。然而,对于更高级的功能,如语音定制或大量使用,可能需要考虑平台的收费政策。目前,Fish Audio的官方网站的API调用收费标准为
。