1
ハイブを一時的に使用してhdfs上のファイルにいくつかのアクションを実行したいので、内部テーブルを使用したくありません。私は外部テーブルのパフォーマンスについて心配しています。 だから私は、ハイブの表とextenalテーブルの間のパフォーマンスの違いについて 質問してください。ハイブの内部テーブルとエクステンデットテーブルのパフォーマンスの違い
ハイブを一時的に使用してhdfs上のファイルにいくつかのアクションを実行したいので、内部テーブルを使用したくありません。私は外部テーブルのパフォーマンスについて心配しています。 だから私は、ハイブの表とextenalテーブルの間のパフォーマンスの違いについて 質問してください。ハイブの内部テーブルとエクステンデットテーブルのパフォーマンスの違い
ハイブ外部表を作成して使用することができます。私はパフォーマンスの内部と外部の表に大きな違いがないことに気付きませんでした。
パフォーマンスを向上させるために、ハイブによって管理されるORC(ファイル形式)表を作成できます。
Create ORC table:
CREATE TABLE IF NOT EXISTS <orc_table_name>(
<col name> <type>)
COMMENT 'comments'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS ORC;
はその後ORCテーブルに挿入します。
INSERT OVERWRITE TABLE <orc_table_name> SELECT * FROM <external_table_name>;
参照してください:HDFS to Hive external table and ORC
あなたはハイブの内部テーブルと外部テーブルの違いを探している願っています。どうか明らかにしてください。 –
はい、私は間違った言葉を "伸ばす"ことがあります。私は申し訳ありません。正しい言葉を使ってもう一度検索し、答えを得ます。それはそれらの間にパフォーマンスの違いはありません。 –
この回答を参照してください:http://stackoverflow.com/a/37192041/2142994 –