私は10個のセブレータを持っていますが、それぞれは毎日約3G個のログファイルを生成します。私はhadoopチュートリアルを完了し、各マシンにそれぞれのhadoop(HDFS)をインストールしました。私が望むのは、map-reduceを使ってこれらのログを分析することです。複数のノードにまたがるログ用のHadoopハンドル
私の質問は、ハープでMPの毎日のログを有効にする方法ですか?私はそれぞれに行く必要がないように
>hadoop fs -put local_log_path /A/log_20170219.1
、その後
>hadoop jar MR_path MP_driver_class /A/log_20170219.1 output_path.
は、他のより効率的な方法があります:現在、サーバーAのために、私は手動でHDFSディレクトリにログファイルをコピーしますサーバーを作成し、新しく生成されたログを手動でDFSシステムにコピーしますか?コマンドfs -put
には実際に大きなデータファイルがここに移動しますか?