私は文章を分類するために畳み込みニューラルネットワークを訓練しようとしています。私はコードをhereから畳み込みニューラルネットワークの精度を向上
私のデータセットのいずれかで正常に動作します。しかし、別のデータセットでは、そのパフォーマンスは非常に悪いです。 2つのデータセットは、量と文の長さの点で同等です。パフォーマンスの低いデータセットでは、手順の後に損失関数が減少することがわかります。ここで、青は訓練セット用であり、読み取りはテストセット用です。
そして、ここでの精度です:あなたが見ることができるように 、テストセットの減少の損失値が、精度値はほぼ同じです。 修正方法を教えていただけますか? ありがとうございます。
各データセットにはカテゴリラベルがいくつありますか、それぞれのテキストの性質の違いは何ですか? – j314erre
@jmp両方のデータセットについて、クラス数は4です。実際、両方のデータセットは、Twitterから収集されたツイートです。パフォーマンスの良いデータセットは、TwitterのストリームAPI経由で作成され、もう一方はウェブサイトから作成されます。違いは、天気や募集などの自動ボットからのつぶやきを削除するフィルタを使用しないことです。ウェブサイトのデータセットについては、通常の人からのつぶやきのみを保持します。 2つのデータセットにはほぼ同じ数の例があり、同じ前処理技術を適用しています。 – lenhhoxung