2010-12-30 9 views
0

FileInputFormatを拡張したカスタム入力フォーマットがあります。これは、入力ファイルの各行に対して別々の分割を生成します。このファイルは、この行を扱うマッパーが実行するホスト名を提供します。特定のhadoopスレーブのファイル内の行を処理する方法は?

どうすればよいですか?

これは、マッパーがDBからデータを読み込み、マッパーをDBサーバーと同じマシンで実行するために必要です。

答えて

1

Hadoopコードベース内に独自の実装を記述しないと不可能です。

あなたがマップ入力にデータを追加しようとしている場合は、ジョブの引数として渡すと、あなたは、あなたのマップ()でそれを持っていると入力して、それを連結することができます。

+0

私は各マップを特定のノードにスケジュールしようとしています。 –

+0

入力ファイルの各行を特定のホストに置くことができるものであっても、Hadoopは入力行と同じホスト上でマップを実行するのに役立ちます。 –

+0

Hadoopコードベース内で独自の実装を記述することなく、不可能です。 –

関連する問題