Hbaseが内部的にファイルから重複レコードを処理する方法を理解したいと思います。 これを実験するために、テーブルプロパティ、SERDE、列ファミリなどのHBase固有の構成プロパティを使用して、ハイブでEXTERNALテーブルを作成しました。 HBaseで列ファミリのテーブルを作成する必要があります。Hbaseは重複レコードをどのように扱いますか?
重複したレコードを持つソーステーブルからこのHIVEテーブルへの上書きを実行しました。私はこのような意味で重複したレコードによって 、
ID | Name | Surname
1 | Ritesh | Rai
1 | RiteshKumar | Rai
今すぐ挿入の上書きを行った後、私はIDが1の私のHIVEテーブルを照会し、私は私が望んでいたとして出力(1秒)
1 RiteshKumar Rai
を得ましたどちらが更新されるかをHBaseがどのように決定するのか?それはちょうどそれがちょうどシーケンシャルな方法でデータを書くことです。最後のレコードは上書きされ、最新のものとみなされますか?またはそれはどのようにですか?
ありがとうございます。
よろしく、 Govind
のベストプラクティスを見てみることを忘れないでくださいこの場合の価値? –