3

私は文章を分類するために畳み込みニューラルネットワークを訓練しようとしています。私はコードをhereから畳み込みニューラルネットワークの精度を向上

私のデータセットのいずれかで正常に動作します。しかし、別のデータセットでは、そのパフォーマンスは非常に悪いです。 2つのデータセットは、量と文の長さの点で同等です。パフォーマンスの低いデータセットでは、手順の後に損失関数が減少することがわかります。ここで、青は訓練セット用であり、読み取りはテストセット用です。 enter image description here

そして、ここでの精度です:あなたが見ることができるように enter image description here 、テストセットの減少の損失値が、精度値はほぼ同じです。 修正方法を教えていただけますか? ありがとうございます。

+0

各データセットにはカテゴリラベルがいくつありますか、それぞれのテキストの性質の違いは何ですか? – j314erre

+0

@jmp両方のデータセットについて、クラス数は4です。実際、両方のデータセットは、Twitterから収集されたツイートです。パフォーマンスの良いデータセットは、TwitterのストリームAPI経由で作成され、もう一方はウェブサイトから作成されます。違いは、天気や募集などの自動ボットからのつぶやきを削除するフィルタを使用しないことです。ウェブサイトのデータセットについては、通常の人からのつぶやきのみを保持します。 2つのデータセットにはほぼ同じ数の例があり、同じ前処理技術を適用しています。 – lenhhoxung

答えて

1

学習率を下げることはできますか?

+0

私が使用している現在の学習率は、Adamオプティマイザで1e-4です。私は1e-5で試しましたが、今は非常に遅い収束を示しています。 – lenhhoxung

+0

それは良いと思う。あなたはそれを速くするために少し大きめにすることができます。それがどうなるか教えてください。 –

関連する問題