2011-02-02 9 views

答えて

-5

これを達成しました。だから、答えはイエスです。

編集

私はなぜダウン票を知らない、質問には答えを持っていますが、次のように私はそれを達成する方法である:

スリフトは、RESTのAPIよりも軽量であり、いくつかのシナリオになりますjava apiよりもパフォーマンスが優れています.Hadoop Streaming APIを使用し、hbaseと通信するためにThriftを使用する独自のMapper実装を提供しています。

bin/hadoop jar contrib/streaming/hadoop-*-streaming.jar -input input/sample.txt -output output -mapper input/StdInOut.exe -reducer NONE 
+0

問題の解決策を教えてください。 – usahara

+0

Seconded。それを行うことができます知っていることを知って、知っていることを知って*どのように*それを行うにはまだ良いだろう。ちなみに – jamiet

+0

すごい素晴らしい答えです。 – RanchiRhino

0

また、REST API(stargate)を使用することもできます。ただし、サーバーやスターゲートサーバーはMapReduceジョブを実行するのには適していません。両方とも、単一の競合ポイントであり、データの局所性を提供しない別個のデーモンプロセスを必要とする。 Java mapreduce apiは、入力分割のデータローカル領域を識別します。したがって、鍵は.NetでJava APIを使用することです。 This questionは、stdin/stdout経由で.NETアプリケーションを使用できるように、hbase用のストリーミングAPIにサードパーティ製の機能強化を提供します。

+0

しかしスリフトはRESTのAPIよりも軽量であり、いくつかのシナリオでのJava APIよりも多くのパフォーマンスを提供します、私はHadoopのストリーミングAPIを使用し、それをHBaseのと通信するために倹約を使用して自分自身のマッパーの実装を与えてきた、私は」擬似分散モードでmapredueジョブを正常に実行できるようになりましたが、今は完全分散モードでテストするつもりです。hbaseがHDFSをデータストアとして使用するため、問題はないはずです。 – Ali

関連する問題