2016-07-25 13 views
0

私はCloudera hadoopを実行するクラスタに接続するためにAWSでRを使用しようとしています。ここに記載された手順に従う - http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with-impala-and-r/Cloudera RImpala接続が動作しない

これまでのところ、私はjdbcドライバを起動できましたが、impalaに接続することはできませんでした。

enter image description here

調査の結果、impalaデーモンがすべてのワーカー・ノードで実行されていることがわかりました。ポートはこのように構成されています。

enter image description here

また、私は、ワーカーノードのいずれかにログインして聞いているポートを確認しました。私はポート21050リスニングを見ることができ、ここでは接続rimpalaにここで、

enter image description here

ですが、私はワーカーノードのパブリックIPを使用しています。まだそれに接続することができません。私はインパラWeb UIを見るためにパブリックIPとポート25000を使用できますが、jdbcリクエストを受信するこのポートに接続することはできません。誰もがこれで私を助けることができますか?

答えて

0

誰かが助けを求めている場合、私はClouderaのサポートから得た答えをここに示します。

「問題はインパラやClouderaのディストリビューションではありません。問題 はで使用されているドライバである 『Rimpala』。RImaplaはHIVE JDBCに ドライバーを使用しています。あなたは https://github.com/Mu-Sigma/RImpala/blob/master/java/src/main/java/com/musigma/ird/bigdata/RImpala.java でソースコードを確認した場合ドライブとして使用されている通話が "org.apache.hive.jdbc.HiveDriver"であることがわかります。理想的にはRImpalaパッケージは であり、動作するように更新されていません。

関連する問題