IndexTTS 介绍及配图说明开源地址


IndexTTS开源地址
 

GitHub项目地址:
https://github.com/index-tts/index-tts

​核心功能​

  1. 1.​语音克隆​
  • 高精度克隆任意说话人音色
  • 支持中英文混合语音生成
  • 零样本学习(无需目标说话人训练数据)
  1. 1.​情感控制​
  • 预设「快乐/中性/生气」等基础情绪
  • 通过标点符号控制语音停顿节奏
  • 拼音标注强制修正汉字发音(如zhong4对应「重」)
  1. 1.​性能指标​
  • 词汇错误率(WER)0.821(中文)/1.606(英语)
  • 支持实时推理(RTF≤0.1)
  • 超越XTTS、CosyVoice2等基线模型

​部署建议​

 
bash
复制
# 基础环境 conda create -n index-tts python=3.10 pip install torch==2.3.0 transformers==4.49.0

(项目采用Apache-2.0协议,含完整技术文档与演示案例)

image.png

image.png

image.png


收藏

扫描二维码,在手机上阅读
文章目录


    Bytebot:开源AI桌面代理 拥有自己的计算机来为您完成任务的人工智能

    阿里开源AgentScope框架  

    评 论