AI开发编程开源项目音频创作

ChatTTS-语音生成模型

开源爆火文本转语音

标签：声音克隆开源模型开源项目文本转语音语音克隆音色克隆

链接直达手机查看

ChatTTS是一个为对话场景设计的语音生成模型，专门用于大型语言模型（LLM）助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文，并且在视频中展示的是中等参数的版本，使用了约10万小时的中英文数据进行训练。

爆火ChatTTS突破开源语音克隆天花板，ChatTTS 项目爆火，3天斩获9k的Star量。可将文本转换成语音，支持中英文，能模仿他人声音。它自然流畅、支持多说话人，还能预测和控制细粒度韵律特征。目前支持音色克隆，需大量数据。输入文本可自动生成韵律和停顿，手动加入特定词可产生“笑果”。但它还不能处理长文本。

ChatTTS 不仅能说中文，英文也能 hold 住，还支持一些细粒度控制，它允许你加入笑声、说话间的停顿，还有语气词，可玩性很强。

它可以复刻已经逝去的人的绝版声音，想要再听到乔布斯开发布会，随时都可以。听它模仿霉霉的音色，不论是语调还是语气的变化，都挺接近本人，几乎听不出来 AI 味儿。