5
mrjobを使用してファイルのバッチを処理し、統計情報を取得しています。私はmrjobを使用して1つのディレクトリ下のすべてのファイルを繰り返し処理する方法
python count.py <some_input_file> output
のように、単一のファイルでのMapReduceジョブを実行することができます知っているが、どのように私は、スクリプトへのファイルのディレクトリを養うことができますか?ファイルのディレクトリ構造はこのようなものですfolder/subfolders/files
、何か提案はありますか?