語音合成

1 Article

語音合成模型微調訓練流程

本文探討語音合成模型的微調訓練流程,包含資料集分割、自定義資料整理器 `TTSDataCollatorWithSpeakerEmbedding` 的設計與應用,以及關鍵訓練引數的設定與說明。文章以 SpeechT5 模型為例,詳細解析瞭如何使用 Hugging Face Transformers