私はsparkの教科書を読んでいます。私はその変換と動作を見て、再びrdd関数を読んでいます。だから私は混乱しています。誰も変換とspark rdd関数の基本的な違いを説明できます。sparkの変換とrdd関数の違いは何ですか?
両方ともrddデータの内容を変更し、新しいrddを返すために使用されますが、私は正確なexplantionを知りたいと思います。
私はsparkの教科書を読んでいます。私はその変換と動作を見て、再びrdd関数を読んでいます。だから私は混乱しています。誰も変換とspark rdd関数の基本的な違いを説明できます。sparkの変換とrdd関数の違いは何ですか?
両方ともrddデータの内容を変更し、新しいrddを返すために使用されますが、私は正確なexplantionを知りたいと思います。
RDDSは操作の2種類のみをサポートする詳細情報訪問のため 。
RDD Functions
は、内部メカニズムのテキストブックで使用される総称です。
たとえば、MAPは、関数を介して各データセット要素を渡し、結果を表す新しいRDDを返す変換です。 REDUCEは、何らかの関数を使用してRDDのすべての要素を集計し、最終結果をドライバプログラムに返すアクションです。