だから私は現在、私は火花で火花-SQLクエリを使用して読み出し動作を並列化する必要がスパーク-SQLでPOCに取り組んでいますスパークSQL生成間違った上限と下限
JavaRDD<Row> dataset = sqlContext.read().jdbc(jdBcConnectionString, getSqlQuery(), "tran_id"
lowerbound, upperbound, partitions, props).toJavaRDD();
すべてあなたが生成されたクエリ(私の場合はMS SQL Serverです)を調べるまでうまく動作します。
は、UpperBoundクエリはひとつの境界を指定するの本質は、列の値が指定された下界との間にあるすべての行を取得することであると思うだろう
exec sp_executesql N'SELECT * FROM table_name WHERE tran_id >= 770425'
なりながら下界クエリが
exec sp_executesql N'SELECT * FROM table_name WHERE tran_id < 770425 or post_tran_id is null'
です上向き。しかし、これは私がスパークに新しいですしてください、一つは境界を指定の本質は、列の値があるすべての行を取得することであると思うだろう。この