私は無関係のTwitterユーザーのプロファイルを定義するためにTwitterのトピックモデリングを扱っています。私はGensimモジュールを使ってLDAモデルを生成しています。私の質問は、良い入力データを選ぶことです。私は特定のユーザーに割り当てるトピックを生成したいと思います。質問は入力データに関するものです。今では、私自身(スポーツ、IT、政治など)別のカテゴリのユーザーを選んで、そのツイートをモデルに入れて管理する方法を使用していますが、効率的で効果的ではありません。正しい入力データを使ってPythonでTwitterの良いLDAモデルを生成
Twitter全体の意味のあるトピックを生成するには、どのような方法が良いでしょうか?
トピックモデリングのトピックは、ラベルや分類タスクのクラスとは異なるものです。あなたが使用している用語をよく理解して、あなたの質問についてもう一度考えてください。あなたは何を知りたいですか? – jknappen