2016-08-23 8 views
0

私はhadoopを初めて使っています。私が知りたいのは、データの妥当性チェックがどのように行われているかをデータで取り込むかどうかです。データ検証チェックハイブ

1.破損したデータが含まれているかどうかを確認しますか? 2. NULL値を含んでいますか? 3.重複する値が含まれていませんか? 4.同じファイルを同じテーブルにロードしないでください。

あなたが他のデータ検証チェックがこれ以外に行われている知っている場合は、私に教えてください。..

+0

こんにちは、RDMSのような制約はありません。 –

答えて

0

その自由な世界....ノー検証、ハイブが重複して持つことができ、ヌル、破損している(事業賢明)