2017-11-01 14 views
0

私は、Twitterのツイートからのデータを集めようとしています。 これは私のコードです。TwitterクローラでPython

#API 
consumer_key = "API key" 
consumer_secret = "Secret key" 
auth = tweepy.OAuthHandler(consumer_key, consumer_secret) 

#Access Token 
access_token = "Access Token" 
access_token_secret = "Access Token Secret" 
auth.set_access_token(access_token, access_token_secret) 

#Twitter API 
api= tweepy.API(auth) 
location = "%s,%s,%s" % ("35.95","128.25","1000km") 
keyword = "" 
wfile = open(os.getcwd()+"/twitter.txt",mode='w') 
cursor = tweepy.Cursor(api.search, 
        q=keyword, 
        since='2015-01-01', 
        count=100, 
        geocode=location, 
        include_entities=True) 

for i,tweet in enumerate(cursor.items()): 
print("{}:{}".format(i,tweet.text)) 
wfile.wrtie(tweet.text+'\n') 
wfile.close() 

この場合、質問1.

は、ツイートは「2015年1月1日」からですが、それは2015年1月1日〜2015年12月31日」のような日付を割り当てることが可能です'?

質問2.

カウントが、それは2015年1月1日から100件のツイートを収集することを意味している100です。私が与えることができる特定の収集方法はありますか?このような再ツイートされている2015年1月1日からにかかわらず、時系列の受注または100件のツイートの100件のランダムツイートとして最も

質問3.

このコードでは、つぶやきとタグは、私が知ることができる唯一のものです。つぶやきの位置情報を見つける方法はありますか?アップロードされた場所の緯度と経度?

質問4. ハッシュタグのみを取得するにはどうすればよいですか?全体ではなくツイート

はあなたがオペレータまでと以来を使用することができ、非常に

答えて

0

、ありがとうございました。

https://api.twitter.com/1.1/statuses/user_timeline.json?include_entities=true&inc‌​lude_rts=true&screen_name=your_screen_name&since:2011-05-16&until:2011-08-16 

しかし、ちょっとした時間枠内でつぶやきを検索できるので、少しでもうまくできます。いくつかのリソースをチェックアウトするには

copied from