私はAmazonサービスを初めて利用し、Amazon EMRでアプリケーションを実行しようとしました。 >いくつかのファイルで、ハイブのロードデータステートメントをテーブルを作成して、コマンドから選択* - 含まれているハイブスクリプトを作成しAmazon EMR/S3の出力を確認する方法は?
1):
は、そのために私は手順としては続いています。2)S3バケットを作成しました。そして、私はそのオブジェクトを次のようにロードします:ハイブスクリプト、テーブルにロードするファイル。
3)次に、ジョブフロー(サンプルハイブプログラムを使用)を作成しました。入力、出力、およびスクリプトのパス(s3n://bucketname/script.q、s3n://bucketname/input.txt、s3n:// bucketname/out /など)を指定します。ディレクトリを作成しませんでした。私はそれが自動的に作成されると思う。
4)その後、ジョブフローの実行が開始され、しばらくしてSTARTING、BOOTSTRAPING、RUNNING、SHUT DOWNと表示されました。
5)シャットダウン状態では、自動的にシャットダウンし、シャットダウンのFAILES状態を示します。
S3で、私はoutディレクトリを見ませんでした。出力を見るには?デーモン、ノードなどのディレクトリを見ました......
また、Amazon EMRのHDFSからのデータの表示方法は?それは、何かがあなたのハイブのスクリプトで間違っていたしない場合
:
同じ問題がありました。大規模な仕事の後でかなり痛い。残念ながら、私は完了時にジョブを自動終了させます。あなたのデータを追跡することができましたか、それとも失敗したのか? –