Apache SparkでJavaを使用してDataset<Row>
を処理しています。このデータセットのすべての列に対して数学的変換を行う必要があります。基本的には、このデータセットに格納されているすべての値のログを取得し、まだDataset<Row>
を返すことです。 RDDのmap
機能でこれを行う方法を明確に見ていますが、Dataset<Row>
でどうすればいいですか?データセットに変換を適用するApache Spark
コンテキスト:Dataset<Row> old
には、2列のa
とb
が含まれています。私はあなたが何ができるか、両方の列a = log(a)
とb = log(b)
この作品は罰金
ホープなど、あなたがこれまでに何をしたか、何をしようとする、より詳細に説明してくださいデータセットを使用することができ、多くの機能を持っています。 –