Sparkストリーミング(Flume execから)から1分ごとにネットワークのキャプチャされたデータを読み込み、IPアドレスに従ってデータを集め、最後にハイブに保存します。高速化するために、IPアドレス上にパーティションを持つHive ORCテーブルを作成します。うまく動作します。唯一の問題は、それが多くの(いくつのIPアドレスに依存する)小さなファイルを作成するたびに、 "ALTER TABLE ... CONCATENATE;"手動でマージするのは簡単ですが、毎分新しいテーブルファイルを作成するのではなく、最初の1分のテーブルファイルに新しいデータを段階的にマージ/追加できるソリューションがあるかどうか尋ねたいと思っています。どんな提案も感謝しています!ハイブは、定期的に増分データをhdfs内の同じテーブルファイルに追加または挿入できますか?
0
A
答えて
0
私はあきらめますが、Hiveはパフォーマンス上の考慮のために既存のデータファイルにコンテンツを追加できないため、直接的な解決策はありません。今私の代わりに毎週それを連結する、問題はクエリがエラーメッセージ(データファイルを見つけることができないと不平を言う)が連結を行っているときに壊れてしまうので、大きなビジネスへの影響があります。今私はより柔軟で更新/削除操作を提供できるHBaseまたはKuduでHiveを置き換えることを考えています。
関連する問題
- 1. sparklyr hdfsまたはハイブにデータを書き込む
- 2. Gobblin Kafka to HDFS:同じファイルに追加
- 3. ハイブはHDFS上にない外部ロケーションからデータをロードできますか?
- 4. フィールズ値に応じて増分されたフィールドに値を挿入します。
- 5. は、同じ子をjavascriptに再追加できませんか?
- 6. 追加ULは、再帰的に挿入
- 7. 選択的に挿入または更新できますか?
- 8. .datファイルをハイブまたはhdfsにロードする方法は?
- 9. ハイブは、HDFSのフェデレーションに
- 10. 同じコードがあるデータベースにデータを挿入しますが、別のデータベースにデータを挿入しません
- 11. ハイブに挿入
- 12. 同じデータフレーム内に複数のデータを挿入
- 13. ハイブの増分アップデート
- 14. ハイブ/ HDFSは
- 15. メインメソッドまたはメソッド内にActionListener()を追加できますか?
- 16. CSS - 同じクラス内の画像間にスペースを追加できますか?
- 17. 同じマーカーを別のArrayListに追加できますか?
- 18. ハイブ作成テーブルファイル名000000_0?
- 19. フィルタリング後にuitableviewcellにデータを挿入すると、セルの内容は常に同じになります
- 20. ベクトルのpush_backは同じ場所に挿入されますか?
- 21. javascriptは内部クロムページと同じデータにアクセスできます
- 22. 同じデータに余分な列を追加するJavaFX TableView
- 23. SQLは、タイムスタンプを増加させた順序付きリストを挿入します。
- 24. SQLiteにデータ値を挿入するための同期ループ
- 25. dynamodbに挿入している間に同じデータを書き直します
- 26. SQliteの挿入は常に同じインデックスで行われます
- 27. Chromeアプリケーションはウェブページにデータを取得または挿入できますか?
- 28. 同じ固定値を複数の行に挿入します
- 29. 同じDataRowをDataTableに複数回追加できますか?
- 30. 別のテーブルに挿入または更新するときの増分/減分カラム