私はtwitteRを使用して単純な検索を実行したいが、米国内にあるツイートだけを返す。twitteRには緯度/経度とその緯度/経度のジオコード引数があるが、全国のつぶやきは難しいようです。twitteR R内のジオコード引数を検索
米国のつぶやきのみを取得するために引数に入力するものは何ですか?
おかげで、
私はtwitteRを使用して単純な検索を実行したいが、米国内にあるツイートだけを返す。twitteRには緯度/経度とその緯度/経度のジオコード引数があるが、全国のつぶやきは難しいようです。twitteR R内のジオコード引数を検索
米国のつぶやきのみを取得するために引数に入力するものは何ですか?
おかげで、
は、私の周りの簡単な検索を行なったし、ツイッターを内蔵している国の引数を持っていないように見えます。しかし、緯度/経度があるので、アメリカの国のシェイプファイル(つまりポリゴンの点)に空間結合を行うのは非常に簡単です。
この例では、point.in.polygon()
機能のためにshapefile from Census.govとパッケージspatialEcoを使用しています。数十万の座標と数十のポリゴンを持っていても、他のパッケージが提供するものと比べて非常に高速な空間結合関数です。数百万のつぶやきがある場合や、後で複数のポリゴンに参加することを決めた場合など。世界のすべての国 - それはずっと遅くなる可能性があります。しかし、ほとんどの場合、非常に高速です。
(また、私はTwitterのAPIが設定されていないので、私はtweet_idsと緯度/経度と例のデータフレームを使用するつもりです。)
今library(maptools) # to
library(spatialEco)
# First, use setwd() to set working directory to the folder called cb_2015_us_nation_20m
us <- readShapePoly(fn = "cb_2015_us_nation_20m")
# Alternatively, you can use file.choose() and choose the .shp file like so:
us <- readShapePoly(file.choose())
# Create data frame with sample tweets
# Btw, tweet_id 1 is St. Louis, 2 is Toronto, 3 is ouston
tweets <- data.frame(tweet_id = c(1, 2, 3),
latitude = c(38.610543, 43.653226, 29.760427),
longitude = c(-90.337189, -79.383184, -95.369803))
# Use point.in.poly to keep only tweets that are in the US
coordinates(tweets) <- ~longitude+latitude
tweets_in_us <- point.in.poly(tweets, us)
tweets_in_us <- as.data.frame(tweets_in_us)
、あなたが見ればtweets_in_us
あなたは、米国の領域内の緯度/経度のつぶやきだけを表示する必要があります。