私は以下のような文字列を持っています。最初の行はヘッダーで、残りは列の値です。 文字列からデータフレーム(Spark 1.6とJava7)を作成し、col3とcol4の値をDOUBLEとして変換したいとします。スペース区切りのテキストファイルを読み取ってHiveに保存する方法は?
col1 col2 col3 col4 col5
val1 val2 val3 val4 val5
val6 val7 val8 val9 val10
val11 val12 val13 val14 val15
上記のデータフレームを作成した後、値が定数である最初の行に2つのフィールドがあります。
const1 const2 col1 col2 col3 col4 col5
const1 const2 val1 val2 val3 val4 val5
const1 const2 val6 val7 val8 val9 val10
const1 const2 val11 val12 val13 val14 val15
は、私は、スキーマとテーブルをハイブに上記のデータフレームを書きたい(CONST1 int型、CONST2 int型、COL1、COL2ダブルダブル、ダブルcol3という、二重のCOL5、ダブルCOL4)。 私はSpark 1.6とJava7を使用しています。