私はtensorflow-wavenetプログラムをテキスト読み上げに使用しようとしています。tensorflow-wavenetの使い方
これらの手順は次のとおりです。
- ダウンロードTensorflow
- ダウンロードlibrosa
- マシン
python train.py --data_dir=corpus
を要件
- ダウンロードコーパスをインストールし、 "コーパス"
- トレインという名前のディレクトリに置か
- 音声を生成する
python generate.py --wav_out_path=generated.wav --samples 16000 model.ckpt-1000
pip install -r requirements.txt
これを実行した後、テキストファイルの音声読み上げをどのように生成できますか? tensorflow-wavenet pageによると
もしtensorflow-wavenetがぎこすり声を出す以外に何もできないのであれば、機械学習と音声生成を組み合わせて現実的な声を作り出す機能的なプログラムはありますか? – Lumo5
もちろん、ディープマインドはすべての魔法を明らかにすることができないので、彼らの論文では、テキストからスピーチの生成に必要なローカルコンディショニングの仕方が欠落しています。また、ローカルのコンディショニングのために使用する方法で整理されたトレーニングデータが必要です。>音声を音声テキストと組み合わせて使用する必要があります。レポをフォークして自分でやるか、他の天才がやるまで待ちますそれ。 –