ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文,并且在视频中展示的是中等参数的版本,使用了约10万小时的中英文数据进行训练。

爆火ChatTTS突破开源语音克隆天花板,ChatTTS 项目爆火,3天斩获9k的Star量。可将文本转换成语音,支持中英文,能模仿他人声音。它自然流畅、支持多说话人,还能预测和控制细粒度韵律特征。目前支持音色克隆,需大量数据。输入文本可自动生成韵律和停顿,手动加入特定词可产生“笑果”。但它还不能处理长文本。

ChatTTS 不仅能说中文,英文也能 hold 住,还支持一些细粒度控制,它允许你加入笑声、说话间的停顿,还有语气词,可玩性很强。

它可以复刻已经逝去的人的绝版声音,想要再听到乔布斯开发布会,随时都可以。听它模仿霉霉的音色,不论是语调还是语气的变化,都挺接近本人,几乎听不出来 AI 味儿。

ChatTTS-语音生成模型

 

在线体验地址:https://huggingface.co/spaces/Dzkaka/ChatTTS

相关导航

暂无评论

暂无评论...