💡 TTS 小样本 finetune / 声音克隆问题汇总

**如果 12 句 finetune 效果不佳，一般是因为数据集太小了，建议增加数据集，一般是 300 ~ 600 条，数据量和质量越好，合成的效果越好**
数据的质量要求没有混响，没有杂音，离麦克风距离适中，具体可以参考标贝的数据质量。
finetune 出来的音色与 目标说话人和原始说话人的相似度有关，即目标说话人和原始说话人相似度越高，finetune 出来的音色更接近目标说话人。
finetune 出来的音频质量与原始说话人的音频质量有关，原始说话人的音频质量不好，finetune 出来的效果也可能不好。
综上，finetune 方案在数据采集，选择原始说话人上需要好好选择。

小样本 finetune 原理参考 [关于训练一个自己的TTS模型](https://github.com/PaddlePaddle/PaddleSpeech/discussions/1842)

1. https://github.com/PaddlePaddle/PaddleSpeech/issues/2437
2. https://github.com/PaddlePaddle/PaddleSpeech/issues/2454
3. https://github.com/PaddlePaddle/PaddleSpeech/issues/2383
4. 预处理都没有问题，为什么不跑训练流程？-> epoch 的设置有问题，参考： https://github.com/PaddlePaddle/PaddleSpeech/issues/2319#issuecomment-1231618015
5. https://github.com/PaddlePaddle/PaddleSpeech/issues/2442
6. https://github.com/PaddlePaddle/PaddleSpeech/issues/2471 -> 安装 develop 版本的 paddlespeech
7. https://github.com/PaddlePaddle/PaddleSpeech/issues/2245
8. https://github.com/PaddlePaddle/PaddleSpeech/issues/2485 -> 安装 develop 版本的 paddlespeech
9. https://github.com/PaddlePaddle/PaddleSpeech/issues/2583 -> 推荐使用 finetune 方案
10. https://github.com/PaddlePaddle/PaddleSpeech/issues/2586
11. https://github.com/PaddlePaddle/PaddleSpeech/issues/2607
12. https://github.com/PaddlePaddle/PaddleSpeech/issues/2790
13. https://github.com/PaddlePaddle/PaddleSpeech/issues/2953





Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

💡 TTS 小样本 finetune / 声音克隆问题汇总 #2456

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

💡 TTS 小样本 finetune / 声音克隆问题汇总 #2456

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions