2017-10-13 14 views
-1

tweepyで私はuser_timelineメソッドを使用して200のつぶやきしか得ることができません。tweepy api.user_timeline:数が200に制限されました

class Twitter_User(): 
    def __init__(self,id,count=200): 
     self.id = id 
     self.count = count 
     self.data = None 
    def get_tweets(self): 
     store_tweets = api.user_timeline(self.id, count=self.count) 
     simple_list = [] 
     for status in store_tweets: 
      array = [status._json["text"].strip(), status._json["favorite_count"], status._json["created_at"],status._json["retweet_count"],[h["text"] for h in status._json["entities"]["hashtags"]]] 
      simple_list.append(array) 
     self.data = pd.DataFrame(simple_list, columns=["Text", "Like", "Created at","Retweet","Hashtags"]) 
     self.data = self.data[~self.data["Text"].str.startswith('RT')] 
     return self.data 
    def __repr__(self): 
     id = api.get_user(self.id) 
     return id.screen_name 

私は200以上の数に大きなself.countとして置けば、私は常に200行でデータフレームを取得しますが、私は小さい番号を置けば、私は、行の正しい量を得るinsted。私は知らない、限界がある、または私はいくつかの他の方法を使用する必要がありますか?

答えて

1

。しかし、古いツイートを連続してリクエストすることができます。タイムラインで取得できるツイートの最大数は3200です。参照はhereです。

これはtweepyで行うことができますが、tweepyのCursorでこれらの連続したつぶやきのページを取得する必要があります。開始するにはthisをご覧ください。

1

Twitter API docsによると、あなたが/statuses/user_timeline/から取得することができ、ほとんどのレコードがカウントパラメータの定義から200

です:

は最大値まで、試してみて、取得するために、ツイートの数を指定します。個別のリクエストにつき200のカウントの値は、カウントが適用された後に中断されたコンテンツまたは削除されたコンテンツが削除されるため、返されるツイートの数の制限として最もよく考えられます。たとえinclude_rtsが指定されていなくても、カウントにretweetsを含めます。このAPIメソッドを使用する場合は、常にinclude_rts = 1を送信することをお勧めします。

そしてapi.pyライン114でtweepy source codeから:あなたが唯一のリクエストで200件のツイートの最大値を取得することができます

@property 
def user_timeline(self): 
    """ :reference: https://dev.twitter.com/rest/reference/get/statuses/user_timeline 
     :allowed_param:'id', 'user_id', 'screen_name', 'since_id', 'max_id', 'count', 'include_rts' 
    """ 
    return bind_api(
     api=self, 
     path='/statuses/user_timeline.json', 
     payload_type='status', payload_list=True, 
     allowed_param=['id', 'user_id', 'screen_name', 'since_id', 
         'max_id', 'count', 'include_rts'] 
    ) 
関連する問題