プログラムでHiveを使用してデータにアクセスする必要があります(クエリごとにGB単位のデータ)。私は、CLIドライバVs Hive JDBCドライバを評価していました。Hive JDBC対CLIクライアント
JDBCを使用する場合、トランジションサーバに余分なオーバーヘッドがあります&私はそれがどれほど重いかを理解しようとしています。また、複数のクライアントが単一のリフトサーバーに接続すると、単一ポイントのボトルネックになる可能性がありますか?あるいは、人々がHadoop上で複数のリサイクルサーバを設定し、ロードバランシングを行うのは一般的なプラクティスですか?
私はより高速なプロトタイプではなく、より良いパフォーマンスを求めています。 ありがとうございます。
あなたのリンクは機能しません! –