1
パーティション分割のためのJava APIを見つける手助けをしてくださいsales
データセットN
のサイズが同じですか?等しいサイズでは、同じ数の行を意味します。スパークデータセットカスタムパーティショナー
Dataset<Row> sales = sparkSession.read().parquet(salesPath);
sales.toJavaRDD().partitions().size(); // returns 1
可能な複製に記載されています同じ数の要素?](http://stackoverflow.com/questions/23127329/how-to-define-custom-partitioner-for-spark-rdds-of-equally-sized-partition-where) –
@ブラッドリーカイザーノー、私は答えが2つの理由のために悪いと確信しています:1)答えはパーティショナーのコードを表示しますが、RDD APIにカスタムパーティショナーを渡す方法を指さないでください。 on 2)パーティショナーコードがScalaにあり、Scala APIがJava APIと異なる場合があります –