1

トピックモデリング(オンラインオプティマイザを使用)のorg.apache.spark.ml.clustering.LDAを に使用しており、org.apache.spark.ml.clustering.LocalLDAModelを返します。しかし、このモデルを使用して、 は、ドキュメント上のトピックの配布を取得する方法とは思われません。古いmllib API(org.apache.spark.mllib.clustering.LocalLDAModel)がまさにそれすなわち​​トピックがありませんml.clustering.LocalLDAModelの分布(..)メソッド

方法 を持っていないが、それがそうである理由 私はわかりません。特に、新しいml.LDAは古い mllib.LDAを使用し、古いmllib.LocalLDAModel自体を新しい ml.LocalLDAModelにラップすると仮定すると、

だから誰か明確にしてください: 1.なぜそうですか? 2.新しいトピックの配信を取得する正しい方法は何か ml.LocalLDAModel

P.S.私はいつも古いAPIを公開するためにスパークコードを変更することができますが、なぜ最初に隠れていたのかわかりません。

答えて

1

はあなたが(datasetはあなたLDAModelインスタンスのfit()メソッドに渡されるデータセットです欲しいものを得る追加の列topicDistributionでデータセットを拡張ldaModel.transform(dataset)を考えてみましょう。

関連する問題