2016-12-06 7 views
0

私はHTKを使って音響モデルを訓練します。私の最後のステップは、電話ガウスの混合物を分割することです。通常、私は常にすべての電話機(内部の状態)を1つずつ段階的に分割してから、再評価して、パフォーマンスが低下すると停止します。HTK:電話で混合物分割電話を最適化する

これで、電話機を1つずつ分割してみることにしました。これは、全体的に同等以上の結果につながるはずです。私のやり方は、すべての電話を分割し、最良の結果につながったものを選び、分割しておき、他のすべてをリセットしてからやり直すことです。しかし、これは時間がかかりすぎる。私は、最高のものだけでなく改善をもたらしたすべてのものを分割し、次の繰り返しに行くことを考えました。

私の質問は次のとおりです。電話機を分割するとパフォーマンスが低下する場合は、後でもう一度分割しようとするとポイントがありますか?または、それをブラックリストに載せて、最後の反復で改善をもたらしたものを試してみてください。

答えて

1

このようなスキームからの改善は、通常、ごくわずかです。 DNN(HTK 3.5でサポートされています)に移動するだけで、はるかに改善された改善が得られます。

電話機を分割するとパフォーマンスが低下する場合は、後で再び分割しようとするとポイントがありますか?または、それをブラックリストに載せて、最後の反復で改善をもたらしたものを試してみてください。

あなたは

+0

感謝をブラックリストに載せることができます!私はHTK 3.5スポーツニューラルネットワークを知らなかった!どのくらいのトレーニングデータが必要なのか分かりますか?私は約66時間の訓練データを持っています。 1つの話者のデータセットは、約1000時間の規模です。ところで、あなたはブラックリストに登録できません。 「b」を分割すると、最初の反復ではパフォーマンスが悪くなりますが、2番目の反復ではパフォーマンスが悪くなりました。 – Sixtease