私はHadoopへの新しいハチですので、この基本的な質問で私を助けてください。MapReduceジョブのための基準は、Hiveで起動する
ハイブで"select * from table where <condition>;"
を実行すると、基礎となるHDFSファイルにフィルタリングを適用する必要があるため、mapreduceが起動することが分かります。
しかし、私は、Hiveにwhere句を指定しないでselect * from table
を実行すると、mapreduceが起動することがあり、時にはそうではありません。私の理解は、理想的には、フィルタリング条件がないのでmapreduceを起動してはならないということです。
誰かが私に説明してくれることがあります。なぜなら、Hiveでmapreduceが起動することはほとんどありません。
ありがとうございました。