官方介绍:****s://github.com/index-tts/index-tts/blob/main/docs/README_zh.md

1、支持单一参考音频,即音色克隆;——audio

2、支持双人参考音频,音色克隆;——dialogue_audio_s2

3、指定情感参考音频;——emo_audio_prompt

4、可调节情感参考音频的权重(emo_alpha,范围0.0-1.0,默认1.0)

5、可直接指定8维情感向量[高兴, 愤怒, 悲伤, 害怕, 厌恶, 忧郁, 惊讶, 平静],如使用惊讶则为[0, 0, 0, 0, 0, 0, 0.45, 0];可用use_random开启随机情感采样(默认False);开启随机采样会降低音色的还原度。

6、可用use_emo_text根据文本自动生成情感向量,可用use_random开启随机情感采样:

7、可直接指定情感文本描述(emo_text),实现文本与情感分离控制;

8、拼音使用注意事项:

IndexTTS2仍然支持中文字符与拼音混合建模。 在使用时,如果需要精确的发音控制,请输入包含特定拼音标注的文本来触发拼音控制功能。 需要注意的是:拼音控制并不是对所有声母韵母(辅音、元音)组合都生效,系统仅保留中文合法拼音的发音。

「Comfyui学习」相关链接(已打包,含配套工作流-模型-插件):****s://pan.quark.cn/s/8567a2826c24

指鹿AI线上LIB主页(可在线运行工作流,关注指鹿不迷路)****s://****liblib.art/userpage/a7c59925c301ddc58f1e3157a6c7b866/publish/workflow

欢迎各位进群一起学习交流:点击链接加入QQ频道【指鹿AI共创社区】:****s://pd.qq.com/s/dqm2fepsg

已开通微信交流群+v:zhiluai2025(注明LIB入群)

B站、红书、抖音搜索:指鹿AI,查看更多视频教程!关注:( ****s://space.bilibili.com/385184178B站主页 红书主页