5
+--------------------+
| value|
+--------------------+
|{"Context":"00AA0...|
+--------------------+
JSONサンプル:
:{"Context":"00AA00AA","MessageType":"1010","Module":"1200"}
どのように私は最も効率的にこのようになりますDataset<Row>
を得ることができます
+--------+-----------+------+
| Context|MessageType|Module|
+--------+-----------+------+
|00AA00AA| 1010| 1200|
+--------+-----------+------+
私はこれらのデータをstreで処理しています
spark
.readStream()
.schema(MyPojo.getSchema())
.json("src/myinput")
しかし、今私はカフカからデータを読んでいると、それは私に別の形式でデータを提供します:午前、私は、ファイルからそれを読んでいる時に火花が彼によって自己を、これを行うことができることを知っています。 私はGsonのようなパーザーを使うことができることを知っていますが、私はそれをするために火花をつけたいと思います。
あなたの答えはtyです。これはうまくいくと思うが、私は本当に読者に私のDFを送るというアイデアは好きではない: –