2016-06-29 17 views
0

JSON形式のツイートのコレクションを取得しました。それらをR data.frameに変換したいと思います。 Iは、(rjsonライブラリを使用して)変換のための次のコードを使用:JSONからRへのツイッターエンティティの解析

lines <- readLines(file,encoding = "UTF-8") 
json <- lapply(1:length(lines),function(i) as.data.frame(t(unlist(fromJSON(lines[i]))))) 
json <- lapply(1:length(json),function(i) json[[i]]) 
data <- rbind.fill(json) 

データ変換はよくuserMentionEntitiesを除いて、行われます。私は、最初のユーザーの言及のみを取得できることがわかりました。 のuserMentionEntities列の代わりに、変換されたdata.frameには、userMentionフィールド(id、name、screenName、start、end、_class)ごとの列が含まれます。

data.frameのツイートにすべてのユーザーの言及を含める方法はありますか? つぶやきデータを別の方法でRに変換する必要がありますか?

答えて

0

streamrパッケージは有用なparserを持っています。 Twitterオブジェクトは混乱することがあります(ネストしたデータフレーム内のネストされたデータフレーム)。しかし、私はほとんどそれをmy parserでソートしました。

+0

解決方法を試しましたが、このエラーが発生します。私はRには新しく、それを修正する方法はわかりません。 > LST - - > lst_ - > - >評価 - >のeval 実行halted' –

+0

私のミスmap_df ... as_data_frame:evalの中 'エラー(exprの、ENVIR、enclosは):機能 "try_catch" 通話を見つけることができませんでした。これは、使用する前にワークスペースに送信しなければならない関数tryCatch()のより小さなバージョンです。独自の決勝戦を書きたい場合は、https://github.com/mkearney/tfse/blob/master/R/data.frame.objects.Rとhttps://github.com/pablobarbera/をご覧ください。 streamR/blob/master/streamR/R/parseTweets.R。あるいは、これらのパッケージの1つをインストールして、既に書かれたコードを使用するだけでもかまいません。 – mkearney

+0

tfseパケットをインストールしようとすると、次のエラーが発生します。 '注:パッケージ 'jsonlite'のS3クラス" AsIs "の仕様は、パッケージ 'DBI'のものと同等です。 警告:S3メソッド 'c.string' の名前空間で宣言されていますが、namespaceExportで エラーが見つかりませんでした(ナノ秒、輸出): 未定義の輸出:get_package_pdf、get_wave、get_wave_data、gg_cols、load_tokens、sn2idは、 エラーをwave_path_name:ロードは '失敗しました –

関連する問題