0
DBに情報を保存するためにPIGとHBASEを使用しています。 DUMPコマンドから取得したデータセットがあり、次の段階でHBASEに格納されます。HbaseとPIGはすべての行を保存しません
DUMP somedata;
は、以下のような重複した行を持つデータのチャンクを生成します。
、すべての重複行が除去(rowkey, cf:1, cf:2 ....)
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4568, deleted, 2.3, next, super)
(12345::456::idea, 4568, deleted, 2.3, next, super)
(12345::456::idea, 4568, deleted, 2.3, next, super)
(12345::456::idea, 4569, deleted, 2.3, next, super)
(12345::456::idea, 4569, deleted, 2.3, next, super)
(12345::456::idea, 4569, deleted, 2.3, next, super)
使用STOREコマンドがHBaseStorageとsomeDataがを格納する格納異なる行。期待された行動かどうかはわかりません。上記のうち
だけでは
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4568, deleted, 2.3, next, super)
(12345::456::idea, 4569, deleted, 2.3, next, super)
を格納し、それがない、いくつかの回でも保存するためにいくつかの行をミス。
誰でもこれを明確にすることはできますか?
あなたのコードとhbaseテーブル定義をplzで追加できますか? – 54l3d