MapReduceジョブで何らかの意味を理解するために、データを解析しています。解析されたデータは、バッチ形式で提供されます。それはスパークストリーミングジョブを通じてハイブ外部テーブルにさらにロードされます。これはリアルタイムプロセスです。今では、_temporaryディレクトリが出力場所に作成されたため、異常なイベントが発生しました。これは、ハイブテーブルへのロードが失敗し、ディレクトリをハイブテーブルにロードできないためです。それは一度だけ起こり、残りの仕事はうまく動作しています。スクリーンショットを参照してください。mapreduceジョブが完了すると、_temporaryディレクトリが出力場所から削除されません。
_temporaryディレクトリさらに空になっているサブディレクトリとしてタスクIDが含まれています。誰も将来これを避けることができるようにこれを解決するのに助けてください。
このディレクトリには何もありませんでした。バッチは正常に完了しました。理想的には_temporaryディレクトリを削除する必要がありますが、ジョブが完了してもそのディレクトリが見つかりました。 –
こんにちは、私はここで同じ問題に直面している、あなたはこの仮説_現代の問題を解決する回避策を見つけましたか? @MohitRaja – KAs