テキスト分類を行うとき、テキストが長いと、ナイーブなベイ分類を使用して非常に満足できるパフォーマンスが得られます。コンテキストが短いテキストに来るときしかし、TwitterのメッセージやStackOverflowの中に、質問内容のように、非常に悪い結果は精度、再現率、ROCのようなほぼすべての指標に、得られる短いテキストメッセージをパフォーマンスの長いテキストより効果的に分類する方法
...
されていますが、いくつかのこれらの短いテキストコンテンツを分類するのに役立つことができる実際的な提案ですか?
私はこれにはすばらしいと思います。
あなたの質問を編集して、現在使用しているアルゴリズムやコードを表示してください。実装を改善する方法があるかもしれません – WhiteKnight