-3
私は話者認識システムを作りたいです。おそらく大量のデータが必要になるので、深い学習を使って作りたいとは思っていません。上記のオーディオコンポーネントを使用して実装することはできますか?ピッチ、音色、音量をスピーカーに合わせることはできますか?
私は話者認識システムを作りたいです。おそらく大量のデータが必要になるので、深い学習を使って作りたいとは思っていません。上記のオーディオコンポーネントを使用して実装することはできますか?ピッチ、音色、音量をスピーカーに合わせることはできますか?