twitteRパッケージを使用して、一連の公開Twitterプロファイルをスクラップし、それらのツイートをデータベースに収集しようとしています。私が取り組んでいる問題は、APIが利用可能なつぶやき全体を集めているようではないということです。ここでtwitteRツイートをスキップするパッケージ?
は私のコードです:
library(RColorBrewer)
library(NLP)
library(twitteR)
library(foreign)
library(wordcloud)
library(tm)
library(base64enc)
library(httr)
access_token<-"" #not including these, but the oauth works for me
access_secret<-""
consumer_key<-""
consumer_secret<-""
###Scrapes Twitter Account
setup_twitter_oauth(consumer_key, consumer_secret, access_token, access_secret)
set.seed(123)
user.tweets<-userTimeline('@HillaryClinton', n=3200)
df<-twListToDF(user.tweets)
このコードは、ヒラリー・クリントンのTwitterページから340件のつぶやきをつかみます。しかし、彼女には8,000個以上のつぶやきがあるので、なぜそれらを掴んでいるのか分かりません。私は最も早いツイートの日付をチェックし、今年の4月27日です。 APIの問題はその日付までしか収集していないのですか?
私は考えていませんその私はまた、このコードを友人のツイッタープロファイルで使用しているためです。それは彼の451のつぶやきのわずか106を集めましたが、それは2013年までずっと戻ってきました。しかしその場合、彼が作ったつぶやきをやめていました(彼らはリツイートではありませんでした)。
私のコードで何かが見当たりませんが、私には欠けているuserTimeline関数には何か制限がありますか?
ありがとうございました。
これは、同じ応答を何度も何度も繰り返してくる(ヒラリーがツイートし、新しいツイートをつかんで、最も古いツイートを失うまで)。 Max IDパラメーターとSince_idパラメーターを使用して作業する必要があります。 Twitterこれに関するいくつかの良い文書を提供しています:https://dev.twitter.com/rest/public/timelines –