マレットAPIでLDAトピックモデルがどのように実装されているかを理解しようとしています。 ParallelTopicModel
クラスでは、typeTopicCounts
と呼ばれる2D int配列を見ることができます。この配列は、ビット操作によってbuildInitialTypeTopicCounts()
メソッドで初期化され、後で各ドキュメントで使用されます。私の質問は、この配列の値は何を意味していますか?ソースコードから得られる情報は、[機能索引、トピック索引]によって索引付けされていることだけです。トピックモデリングにおけるtypeTopicCountsの機能マレットAPIの実装
0
A
答えて
0
LDAのギブスサンプリングの計算パフォーマンスは、各ワードトークンのトピックにわたるサンプリング分布を計算することによって支配されます。トピック・モデルは、単語とトピックとの関係においてまばらなものがたくさんあるように設定されています。できるだけ多くの計算を1つの単語から次の単語に保存し、意味のある計算(ゼロで乗算しないなど)を行うだけで、この計算をより効率的にすることができれば、大きなスピードアップを得ることができます。
typeTopicCounts
アレイには、各単語タイプがint
の1つの配列を持っています。この配列内の各int
値の意味は、とビットシフト演算子を使用するトークンカウントの両方をエンコードします。カウントは上位ビットにあるので、整数を「アンパック」せずにカウントでトピックを並べ替えることができます。この方法のためのチュートリアルから
スライドはここに用意されています
https://mimno.infosci.cornell.edu/slides/fast-sparse-sampling.pdf
関連する問題
- 1. マレットを使ったトピックモデリングでバイグラムをサポートするJava Api
- 2. マレットをトピックモデリングに使用している間にステミングを実行する方法
- 3. テンソルフローr1.0におけるアテンションデコーダの実装
- 4. ファサードの実装におけるConcurrentModificationException
- 5. Symbianにおけるサービスの実装
- 6. 機能の実装
- 7. 実装Excelの機能
- 8. APNGレンダリング機能の実装
- 9. C:rownames機能の実装
- 10. ASP.NET APIマイクロサービス向けAPIゲートウェイの実装
- 11. OAuth 2実装期待どおりに機能しない
- 12. win32 APIアプリケーションのグローバリゼーション/多言語機能の実装
- 13. NHibernateにおける同時実行の実装
- 14. 機能プログラミングにおけるチェスプログラミング
- 15. Angular2:Rx.Observable.retry()の機能を実装する
- 16. クロスプラットフォームの 'トースト'機能を実装する
- 17. Google MapsジオコーディングAPI、JS APIに欠けているAPIの機能(?)
- 18. 私のソーシャルネットワーク向けのAPI実装
- 19. Python 2.7におけるisinstance関数のタプルとリストの実装
- 20. ユニット群のサブグループにおける離散対数のSAGE実装
- 21. プリズムの実装におけるインタフェースの重要性
- 22. JavaコードのC実装における出力の差
- 23. OCamlにおける複数の実装とのインタフェース
- 24. strlenの実装におけるコードの理解
- 25. Actorモデルの実装における複数のApache HTTPクライアント
- 26. Androidスタジオブロックのログイン機能の実装
- 27. オクターブでのエラー機能の実装
- 28. Cの "tail -f"機能のカスタム実装
- 29. Verilogの "大多数"機能の実装
- 30. ウェブサイトでの印刷機能の実装