私は、それらに関連する潜在的なトピックを持っている可能性があるドキュメントのコレクションを持っています。各ドキュメントは1つ以上のトピックに関連する可能性があります。私は可能なすべての "トピック" /カテゴリとこれらのトピックの説明のマスターファイルを持っています。私は各文書のトピックを予測するモデルを作成しようとしています。継続的ではなくカテゴリレスポンスを予測するためのsLDA
私はRTextToolsを使用して教師付きのテキスト分類を使用する可能性がありますが、これはドキュメントをあるカテゴリまたは別のカテゴリに属するものに分類するのに役立ちます。私は、文書のトピックの割合を決定するのに役立つだけでなく、用語 - トピック/カテゴリの分布を与える解決策を見つけることを模索しています。 sLDAはよく似ているようですが、カテゴリ別ではなく、連続的な変数の結果しか予測できないようです。
これは方法論的プログラミングの質問の多くであるため、Cross Validatedに投稿する方がよいかもしれません。 – jruf003