データストリーム内のポイントに関連するウェイトがある場合、リザーバサンプリングを実行するアルゴリズムはありますか?加重リザーバサンプリングのアルゴリズムはありますか
13
A
答えて
13
アルゴリズムは、まさにこの問題を解決します。完全な校正を行った原著論文は、2006年情報処理学会レターに「貯留層を用いた無作為抽出サンプリング」というタイトルで出版されていますが、簡単な要約hereがあります。
アルゴリズムは次のように動作します。重み付けされていないリザーバのサンプリングを解決する別の方法は、各要素に0と1の間のランダムなID Rを割り当て、インクリメンタルに(ヒープを使用して)上位k個のIDを追跡することです。今度は加重バージョンを見て、i番目の要素に重みw_iがあるとしましょう。次に、i番目の要素のidをR ^(1/w_i)とすることでアルゴリズムを修正する。ここでRは(0,1)に一様に分布する。
このアルゴリズムに関するもう1つの記事は、Clouderaの人々によってthis oneです。
5
this paper of S. EfraimidisからA-ESアルゴリズムを試すことができます。コード化が非常に簡単で効率的です。このことができます
希望、Pavlos EfraimidisとポールSpirakisによって
ブノワ
関連する問題
- 1. 加重順列アルゴリズム
- 2. 投票加重アルゴリズム
- 3. 正方形と円の重なりを正確に検出するアルゴリズムはありますか?
- 4. パス圧縮アルゴリズム付き加重クイックユニオン
- 5. 予荷重または予荷重はありませんか?
- 6. コンピュータのパフォーマンスを判断するアルゴリズムはありますか?
- 7. このアルゴリズムの名前はありますか?
- 8. LSMツリーのような他のアルゴリズムはありますか?
- 9. 加重スロープ1アルゴリズム? (PythonからRへの移植)
- 10. 塗料シミュレーション用のライブラリ、データ、アルゴリズムはありますか?
- 11. グラフ操作とアルゴリズム用のJavaScriptライブラリはありますか?
- 12. ピック・スペシャル・カテゴリーのアルゴリズムはありますか?
- 13. RのMetropolis-Hastingsアルゴリズム:正しい結果はありますか?
- 14. VF2アルゴリズムの動作例はありますか?
- 15. Delphi用のUnicode照合アルゴリズム(UCA)コードはありますか?
- 16. ラップアラウンドマップの単純な「ポイントイン・イン」アルゴリズムはありますか?
- 17. 「Flip all(Light Out)」ゲームのアルゴリズムはありますか?
- 18. OpenCVのFASTアルゴリズムはどこにありますか?
- 19. Fisher-Yatesシャッフルとリザーバサンプリングの違い
- 20. matlabはすべてのlinprogアルゴリズムを実行しています(アルゴリズムのmatlabリストはありますか?)
- 21. 連想配列に追加 - 重複はありません
- 22. 単語をスクランブルするアルゴリズムはありますか?
- 23. 配色を計算するアルゴリズムはありますか?
- 24. マルチステートメントクエリーをセミコロンで分割するアルゴリズムはありますか?
- 25. ポリゴンにアンカーポイントを適用するアルゴリズムはありますか?
- 26. CSSより重要なものはありますか?
- 27. AES_128_CBCとAES_128_CBC_SHAアルゴリズムに違いはありますか?
- 28. 中点楕円アルゴリズムはありますか?
- 29. nodejsにはdiffライブラリやアルゴリズムがありますか?
- 30. ビテルビCYKアルゴリズムと確率的CYKアルゴリズムの違いは何ですか?違いはありますか?
も広すぎますか?私は質問が非常に特殊なアルゴリズムを求めていると思う。 –
完全に@ JuanA.Navarroに同意します - この質問はストリームや並列処理には非常に便利で、再オープンする必要があります(彼の答えも非常に良いです)。 –