私はデータフレームの代わりにデータセットを使用したいと思います。カスタムケースクラスなしでデータセットに多くのカラムを持つ寄木細工ファイルを読むにはどうすればいいですか?
私は、寄木細工のファイルを読み込み、直接の種類を推測したいよ:
val df: Dataset[Row] = spark.read.parquet(path)
私はDataset[Row]
が、Dataset
を望んでいません。
val df= spark.read.parquet(path).as[myCaseClass]
しかし、私のデータは、多くの列があります。
は、私はのような何かを行うことができます知っています!ケースクラスの作成を避けることができれば、それは素晴らしいことでしょう!
「DataSet」に変換する前に、必要な列を選択することができます。 –