AWS EC2にhadoopとsparkをインストールした後、this tutorialに続いてエラーが発生しました。 AWSのsparkからHDFSにアクセスできます。私はローカルマシンからAWSのHDFSファイルにアクセスしようとするとエラーが発生する
val lines = sc.textFile("hdfs://namenode_public_DNS:9000/datasets/wikipedia/wikipedia.dat")
lines.first()
を通じて私のローカルマシンからHDFSファイルにアクセスしようとすると
はしかし、私はどのように私はこの問題を解決することができ
17/04/10 16:35:41 WARN BlockReaderFactory: I/O error constructing remote block reader.
org.apache.hadoop.net.ConnectTimeoutException: 60000 millis timeout while waiting for channel to be ready for connect. ch : java.nio.channels.SocketChannel[connection-pending remote=/datanode_ip:50010]
を取得しますか?
ありがとうございます。
- すべてのAWSインスタンスはすべてのトラフィックを許可するように設定されています。
- 私は1名前ノードとデータノード1
Namenodeによってクライアントに返されるdatanodeのIPは、ローカルマシンからアクセスできないプライベートIPです。 – franklinsijo