私はハイヴに新しいです。だから、どのように企業がHiveを使っているのか分かりません。あなたにシナリオを与え、私がHiveの使用について概念的に正しいのかどうかを見てみましょう。ハイブ共通使用例は何ですか?
私の会社では、Webサーバーのログファイルをいくつか保存し、ログを常に検索して分析できるようにしたいとします。だから、私はログファイルの列に対応するテーブルの列を作成します。次に、ログファイルをテーブルにロードします。今、データのクエリを開始できます。したがって、データは将来の日付になるので、このテーブルにデータを追加し続けるだけで、常にログファイルをHiveのテーブルとして保持し、検索して分析することができます。
上記のシナリオはよく使用されていますか?それでは、新しいログファイルをテーブルに追加し続けるにはどうしたらいいですか?毎日手動でテーブルに追加し続ける必要がありますか?
あなたは、私が水路を使用することができることを言いましたデータをHDFSに取り込みます。しかし、このデータはどのようにして同じテーブルに追加されますか?答えはおそらくあなたにとって非常に簡単で、あなたは私が知っていると仮定します。しかし、そのデータはどのようにテーブルに追加されますか? –
すべてHiveはHDFS上のメタデータです。 HDFSのパスにデータを追加すると、Hiveはそれを照会することができます –
私はあなたが私の質問を理解するとは思わない。 Hiveを使用してHDFS上のデータを照会できることを理解しています。しかし私はそれらをすべて同じテーブルの一部にしたい。明確にするために、私がMySQLであったと仮定しましょう。データが入ってくると、それを同じテーブルに挿入するだけで、同じテーブルでクエリを作成できます。これは私が望むことです。データが入ってくる次の10年間は、プロセスが同じテーブルにデータを追加するため、クエリで同じテーブルをクエリします。 –