私のコードはリザーバのサンプリングであることを知りたいだけです。私はちょうど処理したいページビューのストリームを持っています。私は一度に1ページビューを処理しています。ただし、ページビューのほとんどは同じなので、ページビューをランダムに選択して(一度に1つずつ処理する)したいだけです。たとえば、ページビューがサンプルサイズ1はレザボアサンプリングと考えられますか?
です。[www.example.com, www.example.com, www.example1.com, www.example3.com, ...]
私は一度に1つの要素を処理しています。ここに私のコードです。
import random
def __init__(self):
self.counter = 0
def processable():
self.counter += 1
return random.random() < 1.0/self.counter
そのコードは意味をなさない。あなたはどこかで定義された 'クラス'を持っていますか?あなたは、アイテムのストリームと全くやり取りしていないようです。 – Blckknght
そのコードはコードベースの一部に過ぎません。私はそれがストリームとやりとりする部分を投稿します。 – toy