2016-04-24 15 views
0

私はTweepyをスクラップするtwitterを使用しています。私はStreaming APIを見てきました。そして、「トラック」の下に、ツイートのテキストを検索するときに可能なリターンを示しています。ほとんどの部分について正確な一致の代わりに単語を含むハッシュタグのスクラップ

https://dev.twitter.com/streaming/overview/request-parameters

私が特定の#でつぶやきを検索し、以下のハッシュタグによAPIのみ(時間厳守は、直接以下または巻頭で、いくつかの余分な例)完全一致を返しますようです言葉pillow。だから私は希望この例では、ツイート:

#pillow #mybedpillow #mypillowbed

しかし、私はAPIの追跡#pillowを使用する場合、私は唯一の私がpillowをすれば、私は意志#pillow

と正確に一致を取得します#pillowでつぶやきを取得しますが、それに続くテキストはありません。

私が今見ている唯一のアプローチは、ランダムなつぶやきをストリーミングして、私の場合と一致するハッシュタグをフィルタリングすることです。これは、私が必要とするデータを収集するのにずっと時間がかかります。何かご意見は?

答えて

0

このスレッドは、あなたの努力のために役立つ場合があります。 Regexは問題の解決策になります:Best HashTag Regex

関連する問題