csv(> 900 GB)のデータファイルがHive 0.14テーブルが定義されているHDFSファイルシステムに格納されているシナリオがあります。データの分析クエリを実行する必要はなく、データの更新も実行する必要があります。基本的に、このデータ量のRDBMSの種類のシステム。 RDBMSの種類のシステム(Updates、Select)の潜在的な選択肢は何かを提案して、マインドパフォーマンスを重要な基準にしておくことができます。ビッグデータ用RDBMS
1
A
答えて
0
PostgreSQLは、EDLからデータをロードするのに最適なオプションです。ホットデータをそこに置いて、速いクエリーを実行することができます。
+0
バッチをロードしようとすると毎日のデータ。現在、バッチデータの量は日常的には約300GB +近くになる可能性があります。このデータをポストグレーズに入れることは、それ自体時間のかかる仕事です。我々は、オープンソースとして利用可能な大規模なデータの世界で何らかのRDBMSを探しています –
関連する問題
- 1. がビッグデータ
- 2. ビッグデータ修正ステッカー
- 3. RToolsビッグデータとビジュアルスタジオ
- 4. ディープオートエンコーダートレーニング、小データ対ビッグデータ
- 5. RDBMSキーコンフル
- 6. クエリ駆動型モデリングとビッグデータ
- 7. Meteor:MongoDB Joinのビッグデータのスピードアップ?
- 8. MySQLとDB2 RDBMS
- 9. RDBMS Webサービス
- 10. rdbmsのセキュリティ
- 11. Springデータフローサーバー - RDBMS
- 12. Tornado RDBMS統合
- 13. どのRDBMSを使用しますか?
- 14. RDBMSシャーディング用のパーティションキーの生成
- 15. 複数のテーブルとビッグデータを使用したクエリの最適化
- 16. Solr/RDBMS同期DataImportHandler
- 17. Spring XDとOracle RDBMS
- 18. RDBMSリレーショナル代数例
- 19. スパークストームまたはフリンク - ビッグデータ分析
- 20. リレーショナルデータベースからビッグデータへの移行
- 21. RDBMSの多対多関係
- 22. RDBMSデータ関係の負担
- 23. HBaseデータをRDBMSにエクスポート
- 24. CMSとRDBMSの相違点
- 25. RDBMSのフレンズとフォロワーのモデリング
- 26. VoltDB RDBMSのパフォーマンス測定
- 27. rdbms "view"相当のorientdb
- 28. オリオンとRDBMSデータベース(No Mongo)
- 29. C++を使用してrecv()関数でビッグデータを受け取る方法は?
- 30. RDBMSデータベースを使用したテストデータの作成?
ハイブは、更新クエリと分析クエリをサポートしています。あなたが達成しようとしている特定のものは、ハイブを使ってできないことは何ですか? –
@piyushpankajハイブは更新をサポートしていますが、この多くのデータを考慮すると非常にコストがかかるでしょう。 – philantrovert
私たちが直面している正確な問題です。 Hiveテーブルのデータに更新する必要がある特定のメトリックを導出する複数のシステムが存在する可能性があるため、できるだけ早く更新を継続したいと考えています。 –