私のアプリケーションでは、マップマップマップ(4レベルのネストマップ)のマップのためにAvroスキーマを定義する必要があります。私は最後のマップ(最終的な内部マップ)を除くすべてのレベルでキーを使用しています。私はスキーマの長所と短所を知りたい。パフォーマンスに問題はありますか?避ける方法Avroスキーマ内のマップマップマップ
答えて
常にネストマップを使用しないでください。
AVROファイル形式はスキーマベースです。ネストされたマップを使用すると、スキーマの設計が難しくなります。また、avroはシリアル化技術に基づいて動作します。 "String"を使用して作業する場合は、正常に動作しますが、他のデータ型の場合は動作しません。
スキーマ設計に問題はありません。私はすでにスキーマを設計しました。しかし、私はこの賛否両論を知りたいです –
これはパフォーマンスの低下です。デシリアライゼーションのたびに、オブジェクト全体が再作成されます。ネストマップを使用する場合は、同じマップを再作成することがどれほど難しいか考えてください。 – Vijayakumar
あなたのスキーママップの選択>>を見ると、与えられたキーのために多くの価値があることを意味します。
これは、円柱のような円柱データストレージの検索を開始する古典的なケースです。
AVROを寄せ木で混合し、Avroスキーマを平坦化します。
ParquetはColumnarデータ形式なので、繰り返しデータは複数回は格納されませんが、1回だけ格納されます。
ORCを使用すると、あなたは答えてAVRO
http://bytepadding.com/big-data/spark/read-write-parquet-files-using-spark/
- 1. XMLスキーマのcomplexTypesを避ける方法
- 2. 避けスキーマの不一致
- 3. スキーマのないダンプAvroバイト
- 4. Kafka Avroスキーマの進化
- 5. avroスキーマのオプション配列
- 6. avroスキーマでbyte []とLocalDateTimeを定義する方法は?
- 7. Entity FrameworkでOracleスキーマ名を避ける
- 8. 方解石のメモリ内での集計を避ける方法
- 9. HDFSでのAvroスキーマの生成
- 10. データファイルからのAvroスキーマの解析
- 11. Avro:デシリアライズjson - オプションのフィールドを持つスキーマ
- 12. Apache Avroスキーマのリストまたはコレクション
- 13. 避ける方法.IllegalStateException
- 14. NSCachedImageRepを避ける方法
- 15. 避ける方法#ifdef __x86_64__
- 16. 避ける方法Uncaught ReferenceError
- 17. 避ける方法? .htaccessファイル
- 18. スパークでAVROスキーマにデータをシリアル化する方法(Javaの場合)?
- 19. ハンドルバーヘルパー内での..ルックアップの使用を避ける方法
- 20. csvを避ける方法インデックスを避ける?
- 21. Jenkinsfile内のgitコマンドでJenkinsトリガーを避ける方法
- 22. avroスキーマを知らなくても、Avroエンコードされたkafkaメッセージをスカラーで読む方法は?
- 23. 埋め込みスキーマを持つKafkaからAvroを逆シリアル化する方法
- 24. スキーマを使用したAvroメッセージ
- 25. Avroスキーマを集中化したApache Kafka
- 26. Map <Integer、Map <Integer、Float >>のAvroスキーマの作成方法?
- 27. apache avroの使用方法
- 28. androidのcreateBitmap()クラッシュを避ける方法
- 29. 入力のラベルを避ける方法
- 30. メインテーブルのスキャンを避ける方法
インポッシブルするための単純なスキーマを持つことになります。それはデータによって異なります。厳密に必要な場合、必ずしも4レベルのマップは問題ではありませんが、そうではないと思われます。 – Michael
アプリケーションのパフォーマンスはどうですか? –