sparkを使用してかなり大きなjsonファイルを処理する必要があります。私はjsonのすべてのフィールドを必要とせず、実際にそれらの一部だけを読みたいと思っています(すべてのフィールドとプロジェクトを読み込むわけではありません)。 私はjsonコネクタを使用して、読み込みたいフィールドのみを含む部分読み取りスキーマを与えることができるかどうか疑問に思っていました。スパークは部分スキーマでjsonを読む
0
A
答えて
0
jsonが複数行かどうかによって異なります。現在、データフレームとして単一行のjsonのみをサポートしています。 spark 2.3の次のリリースでは、複数行JSONをサポートします。
しかし、あなたの質問です。私はあなたがjsonで読むために部分的なスキーマを使用することはできないと思います。まず、データフレームとして読み込むための完全なスキーマを提供し、その後、個別のスキーマを構築するために必要な特定の列を個別のデータフレームとして選択することができます。スパークの遅延評価を使用し、SQLエンジンがフィルタを押し下げることができるため、パフォーマンスは悪くありません。
関連する問題
- 1. スパークでGoogleバケットファイルを読む
- 2. javascriptで外部jsonファイルを読む
- 3. Pythonでデータファイルの部分を読む
- 4. jsonスキーマをwebpackでtypescriptに動的に読み込む方法
- 5. スパーク・エラーローカルFSからJSONファイルを読むために
- 6. 部分ビューで部分ビューを読み込むことはできますか?
- 7. Rails:jQueryで部分的に読み込む
- 8. スパークSQLスキーマ
- 9. Spark 2.0.0可変スキーマを使用したjsonデータを読む
- 10. ベクトルの未知の部分を読む
- 11. スパーク - 追加のテキストを含むjsonファイル
- 12. 分度器テストでJSONを読み込む方法は?
- 13. スパークの問題CSVを読む
- 14. フィルタパーティションを読み込む前にハイブテーブル(スパーク)
- 15. は、動的スキーマSQL表示のスパークで
- 16. 部分的なJsonデータを複数選択ドロップダウンリストに読み込む方法
- 17. ブラウザでjsonを読むブックマークレット
- 18. Javaでjsonファイルを読む
- 19. sparkでjsonを読む
- 20. PythonでJSONデータを読む
- 21. PHPでフォーム.jsonを読む
- 22. ハイブでダイナミックJsonを読む
- 23. androidでJson Arrayを読む
- 24. node.jsでjsonファイルを読む
- 25. JQueryでJsonフィールドを読む
- 26. JavaでJSONファイルを読む
- 27. jsonファイルを読む
- 28. ダイナミックJsonを読む
- 29. イベントカレンダーを部分的に読み込む方法は?
- 30. MVCの部分ビューでJQueryを読み込む
と1行あたり1つのjsonだとしますか? – Raytracer
https://issues.apache.org/jira/browse/SPARK-18352を参考にしてください – xuanyue