2012-04-17 2 views
1

twitter検索apiのページング+ next_pageの目的は何ですか? - 期待通りにデータをピボットしません。twitter search api + paging + max_id + next_page

私は検索APIを試していて、次のクエリの変更が残っていることに気付きました。 このURLは検索API「next_page」から返されました。

http://search.twitter.com/search.json?page=3&max_id=192123600919216128&q=IndieFilmLove&rpp=100&include_entities=1

ヒットトレンドトピックのリフレッシュと、ページが一定でないことがわかります。

トレンドトピックのすべての15ページを反復すると、各ページの最初の数アイテムで重複して実行されます。

データを集約していた場合、ページング変数+ next_pageは役に立たないようです。ページ1は、傾向のあるトピックの数分で3ページになります。新しいデータがページを押し下げているので、各ページの1〜3の項目に重複してしまいます。

これを回避する唯一の方法は、ここで説明したようにnext_pageおよびまたはページング・パラメータを使用してませである:

https://dev.twitter.com/discussions/3809

私はmax_idとして設定私の既存の結果から、最も古いIDを渡します。私は ページを通過しません。

どのアプローチがデータを集計する方が良いですか?

私はnext_pageを使用できますが、この15ページの実行で既に処理されたステータスはスキップできます。

または

使用のみmax_idとhttp://dev.twitter.com/docs/working-with-timelines Twitterのタイムラインに文書で自分の作業では、すでに処理

==============

+0

next_pageを使用しています.15ページに制限されています。 max_idを直接使うことで、1/users/lookup.jsonが結果セットを返すのを止める前に、3093のステータスエントリ+ユーザプロファイルをインポートすることができました。 –

答えて

2

をスキップするには、使用したカーソお勧めしますmax_idパラメータは、ページごとにタイムラインをステップインしようとするよりも優先されます。

+0

参照はいつ作成されましたか?私は4月にこれが必要でした。私は観測に基づいてmax_idを使った。私はそれが私が行ったアプローチであるので、答えとしてマークします。 –

+0

私は知らない - 申し訳ありません。あなたの所見にスポットがあったように聞こえます。 – dumbledad