私はHadoopのとハイブに新しいです、と私はハイブのinsert into
とload data
声明について混乱しています。ハイブ違いは
INSERT INTO TABLE_NAME (field1, field2) VALUES(value1, value2);
を実行すると、hiveserverはmapReduceタスクを実行します。
私がLOAD DATA LOCAL INPATH PATH_TO_MY_DATA INTO TABLE TABLE_NAME;
を実行すると、ファイルからデータをロードするだけで何もしません。
pyhs2を使用し、insert
ステートメントを使用してデータレコードを保存すると、各レコードはmapReduceタスクを実行し、非常に遅いです。 まずデータをどこかに保存し、後でload data
ステートメントを使用してロードする必要がありますか?
ご迷惑をおかけして申し訳ありません。 – tinyproxy