2011-07-22 9 views
0

あなたが読む前に英語が流暢ではないことに注意してください。 私はNoSQLで新しく、ファイル保存用にHBaseを使用しようとしています。 HBaseにファイルをバイナリとして保存します。 統計は必要ありません。私が必要とするのはファイルストレージだけです。 はお勧めです!?!?ファイルI/O用のHbase。リモートクライアントにHDFSを接続する方法

I/O速度が心配です。

実際には、hadoopとHDFSを接続する方法が見つからなかったので、私はファイル保存用にHBaseを試してみたいと思っています。クライアントコンピュータにHadoopをセットアップすることはできません。私はクライアントがHDFSにファイルを手に入れるのを助ける、RDBMSのためのJDBCのようないくつかのライブラリを見つけることを試みていました。私は何も見つけられず、接続ライブラリの代わりにHBaseを選択しただけです。

誰かから助けを得ることはできますか?

答えて

1

実際のファイルサイズによって異なります。 Hbaseでは、ファイルまたはLOBを格納することは一般的に推奨されません。デフォルトの最大キー値は10MBです。私はその限界を上げ、> 100mbの値でテストを実行しましたが、メモリ内のすべての値を保持する必要があるため、領域サーバーを危険にさらします.JVMメモリを注意深く設定してください。

このタイプの質問がhbase-users listserveで尋ねられた場合、ファイルが大きくなる可能性がある場合は、通常の応答はHDFSを使用することをお勧めします。

Thriftを使用してHDFSに接続すると、クライアントコンピュータにHadoopクライアントのインストールをバイパスすることができます。

+0

@ Byung私は理解していません - それらのファイル/秒のパフォーマンス番号ですか?あなたが多くのクライアントを持っている場合、Hbaseは一般的にスループットに輝きます。 Javaを使用している場合は、調べたい[マルチスレッド非同期クライアント](https://github.com/danirayan/asynchbase)があります。 – cftarnas

+0

ありがとうございました〜!あなたの答えを読む前に、私はHDFSとHBaseの間でパフォーマンスの読み書きをしました。 これはこれです。ファイルサイズ:20k〜1mファイル数:200 HDFS書き込み:50079読み取り:44953 HBase書き込み:16640読み取り:2766 am何か〜が恋しいですか? –

関連する問題