私は大量のTwitterデータを保存しており、一度にデータを処理するために約500kレコードを取得したいと考えています。私は基本的なツイートデータが含まれているTwitterTweetのmongo文書を持っており、次のようにそれを取得しよう:Mongoマッパーで大量のデータを効率的に取得できますか?
weekly_tweets = TwitterTweet.all(:created_at.gt => 1.week.ago, :fields => [:created_at, :text, :from_user])
トラブルをされ、これは時間とメモリの多くを取る - この多くを作るためにどのような方法がありますスケーラブルで効率的です。私はmap reduceを使うことを考えていましたが、私がやりたいこと、つまりつぶやきのテキスト処理と正規表現の仕掛けには非常に複雑です。
なぜ、それ以上の電話はありませんか?スキップとリミットを使用し、一度に1000を取る。 –