sparkストリーミングジョブでjsonデータを読み取ろうとしています。 デフォルトでは、sqlContext.read.json(rdd)はすべてのマップ型を構造体型に変換しています。JSON構造体とsqlContextを使用して[String、String]をマップする
|-- legal_name: struct (nullable = true)
| |-- first_name: string (nullable = true)
| |-- last_name: string (nullable = true)
| |-- middle_name: string (nullable = true)
しかし、私はsqlContext
以下ヴァルA = sqlContext.sql( "student_recordから*を選択する")
を使用してハイブテーブルから読み込まれたスキーマです。
|-- leagalname: map (nullable = true)
| |-- key: string
| |-- value: string (valueContainsNull = true)
read.json(rdd)を使用してデータを読み取り、マップデータ型を取得する方法はありますか。
任意のヘルプは高く評価され spark.sql.schema.convertStructToMap
のような任意のオプションがあります。