Hbaseでは、hbase.hregion.max.filesize
を10GBに設定しました。単一行が10GBのサイズを超える場合、Hbase分割は行キーに基づいて行われるため、行は2つの領域に分割されませんHbaseの単一行がhbase.hregion.max.filesizeを超えた場合のパフォーマンスの問題
たとえば、1000個の列を持ち、各列が25MB〜 40 MB。したがって、定義された領域サイズを超える可能性があります。この場合、行キーのみを使用してデータを読み取ったり、列修飾子を使用して行キーを使用してデータを読み取っているとき、パフォーマンスにどのような影響がありますか?
最適なサイズで見ることができます。それに基づいて私は行のキーを設計します。また、私はこれらの情報を得ることができますか? – Roshan
AFAIK、最適なサイズはありませんが、1行あたり10メガバイトまでのプロトメントメッセージを保存し、mapreduceで処理しましたが、キャッシュサイズ(プリフェッチされたレコード数)を500から200に減らす必要があります。 GBsでないmbs –