2017-06-27 7 views
1

sparklyrを使用してhdfsまたはハイブにデータを書き込もうとしましたが、方法を見つけることができませんでした。 sparklyrを使ってRデータフレームをhdfsやハイブに書き込むことも可能ですか?私のRとhadoopは2つの異なるサーバーで動作しているので、Rからリモートのhdfsに書き込む方法が必要です。sparklyr hdfsまたはハイブにデータを書き込む

よろしく ラーフル

+0

を使用すると、糸モードでスパークを実行しようとしたことがありますか? [This](https://stackoverflow.com/questions/38102921/can-sparklyr-be-used-with-spark-deployed-on-yarn-managed-hadoop-cluster)投稿が参考になるかもしれません。 – mrjoseph

答えて

0

あなたはスパークにデータフレームをコピーするsdf_copy_toを使用することができ、TEMPTABLEを言うことができます。次に、DBI::dbGetQuery(sc, "INSERT INTO TABLE MyHiveTable SELECT * FROM tempTable")を使用して、データフレームレコードをハイブテーブルに挿入します。

1

Sparklyrを使用してハイブにスパークテーブルの書き込み:

iris_spark_table <- copy_to(sc, iris, overwrite = TRUE) 
sdf_copy_to(sc, iris_spark_table) 
DBI::dbGetQuery(sc, "create table iris_hive as SELECT * FROM iris_spark_table") 
+0

共有していただきありがとうございます。これにより、ハイブのデフォルトデータベースにデータがロードされます。ファイルをエクスポートするハイブデータベースを変更する方法を知っていますか? – bshelt141

関連する問題