2016-05-23 6 views
0

私は通常、パテを介してゲートウェイノードに接続し、その上にハイブクエリを実行します。ハイブ - 後で参照するハイブクエリ結果を保存するにはどうしたらいいですか?

いくつかの場合、クエリは数時間一緒に実行されます。少なくとも数回は、パテは切断され、クエリの実行も中止されます。

ハイブのクエリ結果を何らかの形で保存する方法はありますか?それで後でポイントを調べることができますか?

結果を格納するためだけに別のテーブルを作成する必要はありません。

+1

だから、基本的に、あなたがバックグラウンドでクエリを実行し、テキストファイルに結果をダンプしたいあなたの結果保存できますか? 'nohup hive -e 'のように、' nohup'や 'batch'のようなユーティリティが40年以上も存在しています...例えば、$ HOME/query.log 1> $からSELECT COUNT(*) HOME/query.out& ' –

+0

@Samson Scharfrichter:すみません、私は大失敗をしました。質問を更新しました。 putty disconnectでクエリが中止されました。あなたの答えは役に立ちます!ありがとう。 – Marco99

+1

また、PuTTYステップを回避することもできます。**クラスタ内でHiveServer2を実行している場合** **ポート10000でPCをHS2マシンに接続できないようにするファイアウォールがない場合**、 * Hive CLI変数を使用しない - > DBVisualizerまたは同様のユーティリティーをインストールする、Hive JDBCドライバーをインストールする*(好ましくはClouderaドライバー、無償ダウンロード、Apacheドライバーは追加のJARのsmorgasbordを必要とする、互換性保証はない古いHiveServer2バージョンと比較して、Kerberos認証で設定するのは難しい)*、そしてあなたのPCから直接問い合わせを実行します。 –

答えて

2

あなたは

INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM table 
+0

puttyの接続が切断されてもクエリは実行され続けますか?ありがとう。 – Marco99

関連する問題