2017-06-29 2 views
1

Accumuloデータベースに大量のデータを取り込んでいます。タブレットが分割されていません

私のタブレット分割閾値は4Gです。

私のプログラムの作業中に、錠剤がいっぱいになって、いずれかが4Gを超えると、新しいタブレットが作成されますが、は常に空のままです。最終的に私があるよりも、見

> 200錠作成した(最初の数は30だった)が、それらのすべてが空である - 次のコマンドで確認:

hadoop fs -du -h /apps/accumulo/data/tables/3/ 

結果:

16.9 G /apps/accumulo/data/tables/3/default_tablet 16.4 G /apps/accumulo/data/tables/3/t-0000cr6 16.6 G /apps/accumulo/data/tables/3/t-0000cr7 16.3 G /apps/accumulo/data/tables/3/t-0000cr8 17.3 G /apps/accumulo/data/tables/3/t-0000cr9 17.2 G /apps/accumulo/data/tables/3/t-0000cra 18.4 G /apps/accumulo/data/tables/3/t-0000crb 16.9 G /apps/accumulo/data/tables/3/t-0000crc 16.5 G /apps/accumulo/data/tables/3/t-0000crd 17.4 G /apps/accumulo/data/tables/3/t-0000cre 16.4 G /apps/accumulo/data/tables/3/t-0000crf 16.5 G /apps/accumulo/data/tables/3/t-0000crg 16.3 G /apps/accumulo/data/tables/3/t-0000crh 17.6 G /apps/accumulo/data/tables/3/t-0000cri 16.9 G /apps/accumulo/data/tables/3/t-0000crj 16.8 G /apps/accumulo/data/tables/3/t-0000crk 17.1 G /apps/accumulo/data/tables/3/t-0000crl 17.4 G /apps/accumulo/data/tables/3/t-0000crm 17.2 G /apps/accumulo/data/tables/3/t-0000crn 17.1 G /apps/accumulo/data/tables/3/t-0000cro 17.4 G /apps/accumulo/data/tables/3/t-0000crp 19.8 G /apps/accumulo/data/tables/3/t-0000crq 17.0 G /apps/accumulo/data/tables/3/t-0000crr 16.6 G /apps/accumulo/data/tables/3/t-0000crs 16.7 G /apps/accumulo/data/tables/3/t-0000crt 16.7 G /apps/accumulo/data/tables/3/t-0000cru 17.7 G /apps/accumulo/data/tables/3/t-0000crv 16.7 G /apps/accumulo/data/tables/3/t-0000crw 16.7 G /apps/accumulo/data/tables/3/t-0000crx 16.2 G /apps/accumulo/data/tables/3/t-0000cry 0 /apps/accumulo/data/tables/3/t-000109c 0 /apps/accumulo/data/tables/3/t-000118l 0 /apps/accumulo/data/tables/3/t-00011bv 0 /apps/accumulo/data/tables/3/t-00011cs 0 /apps/accumulo/data/tables/3/t-00011nx 0 /apps/accumulo/data/tables/3/t-0001212 0 /apps/accumulo/data/tables/3/t-00 0 /apps/accumulo/data/tables/3/t-00012a3 0 /apps/accumulo/data/tables/3/t-00012gn 0 /apps/accumulo/data/tables/3/t-00012ku 0 /apps/accumulo/data/tables/3/t-00012nf

残りのタブレットもすべて空です。

これは私にとって意味をなさないもので、摂取速度が遅くなるのではないかと恐れています。それは既知の問題ですか?期待どおりにタブレットサーバーが分割されていませんか?

+0

警告またはログメッセージが表示されますか? –

+0

@BinaryNerdいいえ、クラスタを管理するためにアンバリを使用していますが、何も表示されません。 –

+0

大量のキーがある場合、タブレットが分割されない理由の1つです。 Accumuloは錠剤の間で鍵を分割しません。あなたのデータはどのように見えますか? Ambariを使用していても、AccumuloのWebフロントエンドにアクセスできるはずです。また、CLIからテーブルの大きな圧縮を試してみましたか? –

答えて

0

Accumuloタブレットは、(この点に関してHBaseとは対照的に)HDFSのディレクトリ外にあるファイルを参照できます。あなたが勇気があれば、accumulo.metadataテーブルの内容を確認することができます:)

テーブルを圧縮し、HDFSの内容をチェックし直してください。コンパクションが完了すると、各タブレットは独自のディレクトリ内のファイルを一意に参照します。

タブレットの「キースペース」の上半分または下半分にしかデータが格納されていない(ひいてはスプリットの1つの娘にデータが含まれている)ようにデータが歪曲している可能性があります。

関連する問題