1
私は、1から10,000までのシーケンス値である列(pk_key)を持つ10,000レコードのRDBMSテーブルを持っているとします。私は火花を介してそれを読むことを計画しています。 私は10個のパーティションに分割する予定です。RDBMSに接続しているときにSparkで分割する
DataFrameReaderのjdbcメソッドでは、私のcolumnNameは "pk_key"になり、numPartitionsは10になります。 lowerBoundとupperBoundはどのようにするべきですか?
PS:私の実際のレコード数ははるかに多いです、私はそれがどのように動作するか理解する必要がありますか?