2017-10-12 4 views
0

私は24個の大きなJSONファイルを持っていますが、私はちょうど各ファイルの小さなランダムサンプルが必要です。このファイルの "stream_in"と共にサンプルを選ぶことは可能ですか?問題は、一部のファイルが大きすぎるため、ファイル全体をstream_inできないか、r内のファイル全体を開くことができないことです。ランダムなサンプルのJSONファイル

Beauty <- stream_in(file("Beauty_5.json")) 
beauty_sample_operational <- sample_n(Beauty, 385) 

それは、この2つのステップを組み合わせることが可能である:

は、これまでのところ私はこのようなstream_inとサンプリングをしましたか?

使用しpackadges:

あなたが行うことができます
dplyr 
jsonlite 

答えて

0

my_files <- list(...list here your files...) 
purrr::map(my_files, ~ stream_in(file(.x)) %>% sample_n(385)) 
+0

私はこれを行うと、私はこのエラーを取得する: 'my_files < - リスト( "Beauty_5.json")'(これCOMANDは作品をこれはできません): 'map(my_files、〜stream_in(file(.x))%>%sample_n(385) open.connection(con、 "rb")のエラー:接続を開くことができません。 ' – Hadsga

+1

このエラーは 'stream_in_line'が' 'Beauty_5.json" 'ファイルを見つけられないことを指定します。 '' Beauty_5.json "'はあなたの現在の作業ディレクトリにありますか? 'my_files < - list.files(pattern = 'json'、full.names = TRUE)'であなたのリスト()内のファイルへのパス全体を指定しようとしましたか? –

関連する問題