ハイブ - 後で参照するハイブクエリ結果を保存するにはどうしたらいいですか？

私は通常、パテを介してゲートウェイノードに接続し、その上にハイブクエリを実行します。ハイブ - 後で参照するハイブクエリ結果を保存するにはどうしたらいいですか？

いくつかの場合、クエリは数時間一緒に実行されます。少なくとも数回は、パテは切断され、クエリの実行も中止されます。

ハイブのクエリ結果を何らかの形で保存する方法はありますか？それで後でポイントを調べることができますか？

結果を格納するためだけに別のテーブルを作成する必要はありません。

2016-05-23 Marco99

だから、基本的に、あなたがバックグラウンドでクエリを実行し、テキストファイルに結果をダンプしたいあなたの結果保存できますか？ 'nohup hive -e 'のように、' nohup'や 'batch'のようなユーティリティが40年以上も存在しています...例えば、$ HOME/query.log 1> $からSELECT COUNT（*） HOME/query.out＆ ' –

@Samson Scharfrichter：すみません、私は大失敗をしました。質問を更新しました。 putty disconnectでクエリが中止されました。あなたの答えは役に立ちます！ありがとう。 – Marco99

また、PuTTYステップを回避することもできます。**クラスタ内でHiveServer2を実行している場合** **ポート10000でPCをHS2マシンに接続できないようにするファイアウォールがない場合**、 * Hive CLI変数を使用しない - > DBVisualizerまたは同様のユーティリティーをインストールする、Hive JDBCドライバーをインストールする*（好ましくはClouderaドライバー、無償ダウンロード、Apacheドライバーは追加のJARのsmorgasbordを必要とする、互換性保証はない古いHiveServer2バージョンと比較して、Kerberos認証で設定するのは難しい）*、そしてあなたのPCから直接問い合わせを実行します。 –

あなたは

INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM table

出典

2016-05-25 04:07:06 TKHN

puttyの接続が切断されてもクエリは実行され続けますか？ありがとう。 – Marco99

ハイブ - 後で参照するハイブクエリ結果を保存するにはどうしたらいいですか？

答えて

関連する問題