2016-05-26 10 views
0

私は75,000の数を得ることができました。その後、重複したIDを取得し続けます。ここに私のコードです。重複しないで大量のフォロワーIDを正しく引き出すことができるように提案を得ることはできますか?pythonを使用してtwitterから700万人のフォロワーIDを取得しています

import tweepy 
import time 

access_token = "..." 
access_token_secret = "..." 
consumer_key = "..." 
consumer_secret = "..." 

auth = tweepy.OAuthHandler(consumer_key, consumer_secret) 
auth.set_access_token(access_token, access_token_secret) 
api = tweepy.API(auth) 


ids = [] 
while True: 
    try: 
     for page in tweepy.Cursor(api.followers_ids, screen_name = "...").pages(): 
      ids.extend(page) 
    except tweepy.TweepError: 
     time.sleep(60*15) 
     continue 
    except StopIteration: 
     pass 
    break 
+0

ids = set()

ids.extend(page)ids = []を変更 – glls

答えて

0

なぜ重複を取得するのか分かりませんが、値をリストではなくセットに入れて効率的に削除できます。

ちょうど私が信者の何百ものカップルといくつかのTwitterのプロフィール上で同じことをやってみましたし、再現することができませんでしたids.update(page)

関連する問題