Javaでプログラムを書くときに、FileSplitを使ってマッパークラスの入力ファイルに名前が見つかることがあります。 (?ストリーミングを使用して)ストリーミングハーププログラムで入力ファイル名を取得
私はPythonでプログラムを書く際にこれを行うには、対応する方法はあり
私は、ApacheのHadoopのストリーミング文書に次を見つけた:
参照設定したパラメータ。ストリーミングジョブの実行中に、 "mapred"パラメータの名前が変換されます。ドット(。) はアンダースコア(_)になります。たとえば、mapred.job.idは 、mapred_job_idになり、mapred.jarはmapred_jarになります。あなたのコードでは、 のパラメータ名にアンダースコアを付けてください。
しかし、私はまだ私のマッパーの中でこれを利用する方法を理解できません。
ご協力いただきまして誠にありがとうございます。
おかげ
Krishnamutryのニーズが「map.input.file」と呼ばれるように見えますが、これはストリーミングジョブに「map_input_file」環境変数として表示される可能性があります。 –
注:ピリオドはアンダースコアに置き換えてください。 –
ありがとうございます。 –