単一ノードのクラスタでHadoop 2.7.3でMapReduceジョブを実行しています。地図の所要時間を計算し、この仕事の仕事を減らすにはどうすればよいですか?レデューサーの所要時間を計算するhadoop
解決済み この質問を表示している人、または同様の問題に直面している人に役立ちます。 Shubhamの答えと私は少し研究@へ ありがとう:それはリソースマネージャとアプリケーションのマスターに分割されました。2.
- ジョブトラッカーは、Hadoopの中で削除されました。ジョブ履歴サーバ(完成されたアプリケーションやジョブに関する統計情報を表示するために)お使いのブラウザにURLを入力」にアクセスするには リソースマネージャにアクセスするには
- 、ブラウザにURLを入力し、「http://localhost:8088」
- http://localhost:19888 "
ジョブヒストリーサーバーにアクセスしようとするとエラーが発生する可能性があります。アプリケーションの履歴がないことがわかります。
i. Run the command in your terminal
$HADOOP_HOME/sbin/mr-jobhistory-daemon.sh --config $HADOOP_CONFIG_DIR start historyserver
ii. Then run the command
jps
You should be able to see the "JobHistoryServer" in the list
iii. Now run the command
netstat -ntlp | grep 19888
:
i. In your terminal, type "nano ~/.bashrc"
ii. Now in this file, where the other hadoop variables are written add the line
export HADOOP_CONFIG_DIR=/usr/local/hadoop/etc/hadoop
iii. Exit out of nano and save the file.
iv. Run the command "source ~/.bashrc"
1.ジョブ履歴サーバ
、手順を開始するには:
- 変更のbashrcファイル
手順:その場合は以下の手順を実行します。
ジョブが完了するとWeb UIが閉じます。ジョブが完了した後に私がアクセスできる情報(多分いくつかのログファイルで)を得る方法はありますか? – alpha
@alphaどのようにしてジョブをクラスタに提出していますか? –
現在、PythonでHadoopストリーミングを使用していますが、Javaコードの記述に切り替える予定です。 @ Shubham – alpha