spark-ec2スクリプトによるaws ec2クラスタセットアップがあります。Zeppelinを使用してaws spark-ec2クラスタおよびs3バケットにアクセスする方法
私はZeppelinをローカルでZeppelinに書き込んで(マスタ経由で)クラスタ上で実行できるようにZeppelinを設定したいと思います。さらに私はs3バケットにアクセスできるようにしたいと考えています。
私はthis guideとthis other oneに従っていますが、私はzeppelinから自分のクラスタにスカラコードを実行できないようです。私は
mvn install -DskipTests -Dspark.version=1.4.1 -Dhadoop.version=2.7.1
でローカルにツェッペリンをインストール
私のセキュリティグループは、AmazonEC2FullAccessとAmazonS3FullAccessの両方に設定しました。
Iは、スパークにツェッペリンのWebappに火花インタプリタプロパティを編集:ローカル[*]
場合Iから7077 ://.us-west-2.compute.amazonaws.comインタプリタで
sc
を試し、私は
java.net.ConnectException: Connection refused at java.net.PlainSocketImpl.socketConnect(Native Method) at java.net.AbstractPlainSocketImpl.doConnect(AbstractPlainSocketImpl.java:345) at java.net.AbstractPlainSocketImpl.connectToAddress(AbstractPlainSocketImpl.java:206) at java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:188) at java.net.SocksSocketImpl.connect(SocksSocketImpl.java:392) at java.net.Socket.connect(Socket.java:589) at org.apache.thrift.transport.TSocket.open(TSocket.java:182) at
このエラーを受け取ります3210 "conf/zeppelin-site.xml"を編集してポートを8082に変更しようとすると、違いはありません。
注:私は最終的にもようなもので、私のS3バケットにアクセスしたいと思う:すべての善意のユーザーが任意のアドバイスを(それはすでにStackOverflowの上で掲載されていなかった)がある場合
sc.hadoopConfiguration.set("fs.s3n.awsAccessKeyId", "xxx")
sc.hadoopConfiguration.set("fs.s3n.awsSecretAccessKey","xxx")
val file = "s3n://<<bucket>>/<<file>>"
val data = sc.textFile(file)
data.first
ください。お知らせ下さい!
あなたは正しいです! EC2セキュリティグループでポートを開くだけでした。ありがとうございました! – liber
偉大な、喜んで:) – Holden