0
私は数多くの検索用語を使ってツイートのコーパスを取得しようとしています。私が持っている1つの問題は、独特のつぶやきを得ることができないということです。つまり、retweetsです。tweepyを使ってユニークなつぶやきを取得する
事前にテキスト処理を行わずにこれらを削除する方法はありますか?
私が今持っているもの:
あなたが追加することができますapi=tweepy.API(auth)
for search in hashtags:
for tweet in tweepy.Cursor(api.search,q=search,count=1000,lang="en").items():
text=repr(tweet.text.encode("utf-8"))
out.write(text+"\n")