1つのタスクに対して他のデータより多くのデータがありますか?これは、なぜより多くのデータを伴うタスクがより重要なものとして加重されるのかを説明することができます。
この場合、データのバランスをとるようにしてください。 どちらの方法でも、私は更新回数ではなく、損失関数を試してみようと思います。あなたが損失関数を定義するときだけ..
としてよくやっていないタスクからのデータをサンプル上になることを行うためのハック方法をより価値が2番目のタスクを作ります。他のタスクに移行する前に同じデータを数回読み取るようにしてください。これにより、ネットワークがフィットすることが重要になります。
また、私はタスク間の切り替えのタイミングで遊ぶだろう。両方のタスクに関する多くのデータがある場合、タスクAを訓練するとき、ネットワークはそれをうまくやる方法を学習します。その後、タスクBを長時間訓練すると、ネットワークは重みを変え、学習したときに「忘れました」タスクAには、それらの重みがタスクBの解決に役立たないので、両方のタスクを数回繰り返しても、ネットワークのトレーニングが終了するタスクは「もっと価値がある」ことになります。すべてのエポックのタスクを混在させるようにしてください(どちらのタスクからもランダムにすべてのバッチをランダムにサンプリングしてください)。
2つの異なるタスクがある場合、 – Dzjkb
@Dzjkb 2つのタスクは強く関連しています。当初、私は2つの別々のネットワークを持っていました。私は共同建築を実験したい。 – ryuzakinho
この方法を試してみると、https://deepmind.com/blog/enabling-continual-learning-in-neural-networks/ – Dzjkb