短いテキスト分類のためのCNNを使用しています(プロダクションタイトルを分類してください)。 短いテキスト分類のCNNは、妥当性検査セットで悪い結果を示します。
損失が異なる: コードはhttp://www.wildml.com/2015/12/implementing-a-cnn-for-text-classification-in-tensorflow/
からtrainningセット、テストセットの精度であり、validatinoセットが打撃です。妥当性検査の喪失は、訓練セットとテストセットの損失より2倍です(私は2枚以上の写真をアップロードできません)。
訓練セットとテストセットはクローラーによってウェブから入手され、 7:3.そして、実際のアプリのメッセージから検証し、手動マーキングでタグ付けします。
私はほとんどすべてのハイパーパラメータを試しました。
アップサンプリング、ダウンサンプリング、ノーサンプリングを試しました。
30、50、75しかし、これらの作業のいずれも0.3、0.5、0.7
embedding_size 1024、2048、5096
ドロップアウトの
バッチサイズ!
は、今は以下PARAM使用:
バッチサイズである2048
embedding_sizeはsentence_length 15
filter_sizeは3,4,5
で30
でありますdropout_probは0.5
l2_lambdaは0です。 .005
最初はオーバーフィットだと思います。しかし、モデルはテストセットでうまく動き、セットを練習します。私は混乱しました!
テストセットとトレーニングセットの間のディストリビューションは大きく異なりますか?
検証セットのパフォーマンスを向上させるにはどうすればよいですか?
プロット内にトレースが正しく表示されていますか?あなたのテスト精度が最高だということは奇妙に思えます。ほぼ間違いなく正しい? –
@chris_anderson Thx!私はそのプロットのトレースが正しく表示されていると確信しています。理由はわかりません。検証精度が低すぎます –
元のチュートリアルの精度を再現できますか?このモデルの検証精度はどのくらいですか? –