最適なスパーククエリを作成してください。あなたは右の データセットをロードした後にどこかのフィルタ演算子を実行すると、対応するSQLクエリを使用してSQLがダウン に場所/フィルタ述語をプッシュしようとスパークデータソース、データセット述語pushdowの後.as(Encoders.kryo)
:私は約predicate pushdownを読みました句(またはデータソースの適切な言語が何であっても )です。
述語プッシュダウンは.as(Encoders.kryo(MyObject.class))
操作の後に機能しますか?
spark
.read()
.parquet(params.getMyObjectsPath())
// As I understand predicate pushdown will work here
// But I should construct MyObject from org.apache.spark.sql.Row manually
.as(Encoders.kryo(MyObject.class))
// QUESTION: will predicate pushdown work here as well?
.collectAsList();