2016-06-14 5 views
0

Twitterで10000ツイートをクロールしたい、ハッシュタグで特定の単語を含む。twitterがFirefoxでハッシュタグをクロールする

などのハッシュタグが含まれています。このような#love。

とツイートのすべてのハッシュタグをクロールします。

たとえば、1つのつぶやきがこのように存在します。

[私は眠い#boring #tired #sleep午前]と私はデータをクロールし、このような結果を見たいです。

"#boring" "#tired" "#sleep"

私が言っているかを理解することを期待。

私は、pythonのtwitter APIを使用してハッシュタグをクロールしようとしました。

が、いくつかのエラーは、この次

私のコードがある:私はこのコードを実行すると、このようなポップアップがある

from tweepy.streaming import StreamListener 
from tweepy import OAuthHandler 
from tweepy import Stream 

#Variables that contains the user credentials to access Twitter API 
access_token = "mytoken" 
access_token_secret = "mytokenscret" 
consumer_key = "consumerkey" 
consumer_secret = "consumersecret" 

class StdOutListener(StreamListener): 

    def on_data(self, data): 
     print data 
     return True 

    def on_error(self, status): 
     print status 


if __name__ == '__main__': 

    l = StdOutListener() 
    auth = OAuthHandler(consumer_key, consumer_secret) 
    auth.set_access_token(access_token, access_token_secret) 
    stream = Stream(auth, l) 
    stream.filter(track=['#happy']) 

を。 enter image description here

これを修正する方法と、特定のハッシュタグを含むツイートのすべてのハッシュタグをクロールする方法。

私はpython 3.3.4とwindows 8.1 64xを試しました。

私を助けてください。

私の質問をお読みいただきありがとうございます。

+1

エラーメッセージも見ましたか?あなたは文字通り 'print'の呼び出しでかっこがありません – Keatinge

+0

@Keatinge私はあなたのコメントのためにprint function python 2.xと3.xを間違えてしまいました! –

答えて

1

あなたはPython 3.0以降を使用していると思われますので、print "Hello world"を使用することはできません。print("Hello world")を使用する必要がありますので、印刷呼び出しを括弧に変更してください。

+0

私は愚かなように間違って感謝します。おかげでたくさん –

+0

いつでも!ハッピーコーディング=] –

関連する問題