だから私の最初のスキーマは次のようになります。ネストされたJSONからデータフレームを作成するにはどうすればよいですか?
root
|-- database: String
|-- table: String
|-- data: struct (nullable = true)
| |-- element1: Int
| |-- element2: Char
show()
結果がある[null,2,3]
などで醜い1つのデータ列
私は何をしたいことはそれ自身のデータフレームにデータ構造体を作ることですので、私
val dfNew = df.select("data")
私が代わりにスキーマで指定された複数の列のshow()
を使用するときだけは本当に私に同じ総列を取得します。ネストされたJSONのデータが列の中に広がるが、何かのように持つことができますなど
これを行う方法はありますか?
可能な複製(http://stackoverflow.com/questions/28332494/querying-spark-sql-dataframe-with-complex-types) – zero323
[チェックアウトパンダ.io.json.json_normalize](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.json.json_normalize.html)。 –