2016-03-29 8 views
0

私は複数のcsvファイルを持っており、それらをCDHテーブルにインポートしたいと思います。私はファイルからデータをインポートするためのsqoopのようなツールがあるかどうかを知りたい。自動的に行う方法やツールはありますか?csvファイルデータをCDHにロードするには?

答えて

1

あなたは色相のWeb UIを使用することができます。

FileBrowserメニューでファイルをhdfsにアップロードします。

その後、あなたは、アップロードされたファイルを持つ新しいテーブルを作成/新しいスキーマを作成し、データブラウザ/メタストア表

を使用することができます。

+0

ありがとう – aakpro

1

標準的な方法は次のとおりです。

CREATE TABLE Something (id int, name string, salary double, ....) row format delimited fields terminated by ‘,’; 

LOAD DATA LOCAL INPATH '/home/yourcsvfile.csv' OVERWRITE INTO TABLE Something; 
+0

1.ファイルをhdfsにロードする必要はありませんか? – aakpro

+0

2.これにより、すべてのデータが正しくロードされますか(int、string、timestamp)? – aakpro

+0

3.私は複数のファイルを持っています。私は2番目のコマンドを繰り返すべきですか? – aakpro