2016-08-01 12 views

答えて

2

データ処理では、すべてのレコードを別々に処理することができます(タイムスタンプ付きレコードはイベントと呼ばれます)、バッチを呼び出したレコードのコレクションを処理できます。

Pigは、入力レコードを1つずつ処理しないため、バッチ処理を実行します。実際に、Pigは入力パス内のすべてのレコードを1つのバッチとしてロードします。

マップReduceはバッチ処理用に設計されたデータ処理フレームワークで、mapreduceはバッチ処理を意味しますが、バッチ処理はmapreduceではありません。

+0

ありがとうございました –

+0

あなたは大歓迎です@非常に、助けになる答えを受け入れてください。 – 54l3d

関連する問題