2011-11-04 5 views
10

私はApache Hadoopについて、集中的な処理を行う素晴らしい方法として多くのことを聞いてきました。 Hadoopの基本的な紹介を探しています。 helloworldと同等で、次にユースケースの例です。Hadoop Hello Worldの例と紹介

答えて

10

WORDCOUNTのサンプルコードは、新しい誰でもit.Itを理解できるようにシンプルですが

https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html#Example:+WordCount+v2.0

だけhaddop APIのEXのすべてを追加することでそれをコンパイル:Hadoopの-core.jar を作成します。 jarファイルをnetbinで実行し、cmdでhadoopを実行すると驚くことでしょう。あなたが別のものをしたい場合は

、私のような... sudoのインデクサーを行った

Cow 2.txt 3.txt 4.txt 
Cat 1.txt 

etc. 

ちょうど私に尋ねる、私はあなたに私はあなたがこの例を実行する必要がありますお勧めしますのでsimple.Butあるコードを提供します最初。

今、私は>>ので、ここで使用するためのリンクがあり、あなたが前のタスクを完了したと思った http://matrixsust.blogspot.com/2011/11/hadoop-simple-indexer-in-map-reduce.html

はそれがお役に立てば幸いです。

+1

そのリンクは404'dで、トップの結果の1つと思われるので、私は思うように更新されたリンクを置くとよいでしょう。 – Acapulco

+1

私はリマインダーのためにリンクを更新しました;) –

3

Hadoopにジャンプする前に、MapReduceの知識が必要です(HadoopはMapReduceに基づいています)。 MapReduceには、videosという素敵なものがあります。 MapReduceのGoogle Paperも確認してください。

また、実際にHadoopに興味がある場合は、Hadoop : The Definitive Guideが必須です。