既存の分類モデルにさらに訓練データを追加したい場合。トレーニングデータにラベルを付けるコストが高いため、既存のモデルに最も価値の高いデータをラベル付けしたいだけです。例えばテンソルフローフレームワークで最も価値の高いトレーニングデータを得る方法
、我々は次の3つの非ラベルデータを予測するために、既存のモデルを使用して、私たちの分類問題に二つのクラス(A/B)を持っている、と確率分布を得る:
Data A B
Case 1: features -> 0.9 0.1
Case 2: features -> 0.6 0.4
Case 3: features -> 0.5 0.5
ケース3現在のモデルはそれが属するクラスを知らないので、最も価値の高いトレーニングデータでなければなりません。そうですか?もしそうならエントロピーはここでは良い指標になるはずですが、私はtf.reduce_entropy
の実装を見つけることができません。tensorflow