2016-10-17 10 views
0

ハナ・ボラにインポートする前に、3つに分割してデータ・クリーンアップを実行する必要があるファイルがあります。そうでなければ、すべてがStringとしてタイプされなければなりません。これは理想的ではありません。Spana DataframeをHana Voraテーブルに保存するにはどうすればいいですか?

データフレームをインポートして準備することはできますが、HDFSファイルシステムに書き込むか、「com.sap.spark.vora」データソースにテーブルとして保存すると、私はエラーが発生します。

火花を準備したデータセットをHana Voraにインポートする信頼できる方法についてアドバイスできますか?ありがとう!

答えて

0

現在、Voraは(APPEND文を使用して)既存のテーブルにデータを追加することを正式にサポートしています。詳細はSAP HANA Vora Developer Guide - >第3.5章「既存のテーブルへのデータの追加」を参照してください。

これは、中間ファイルを作成する必要があることを意味します。 VoraはCSV、ORC、Parquetファイルからの読み取りをサポートしています。データフレームはORCとParquetファイルにSparkから直接保存できます(https://spark.apache.org/docs/1.6.1/sql-programming-guide.htm参照)。 SparkからCSVファイルに書き込むにはhttps://github.com/databricks/spark-csv

関連する問題