HadoopのはHadoopの分散ファイルシステム上のPythonのファイル(の.py)(HDFS)
hadoop jar <jar>
は、今私が代わりにPythonスクリプトを持って使用して、クラスタ上で直接Javaアプリケーションを実行する可能性を提供するを実行する方法Javaアプリケーション。以下は
は、すべての機能なしの.pyファイルの構造体である、ちょうど左「を削除 - ファイル - からフォルダ」の部分import os.path
def transform():
inputfolder = "input"
for filename in os.listdir(inputfolder):
path = inputfolder + "\\" + filename
os.remove(path)
def main():
transform()
if __name__ == "__main__": main()
同様の.pyファイルを実行する方法はあります私は.jarファイルを実行する方法に?
私はPythonとHadoopの新機能です。私のアプローチが完全に消えていて、意味をなさないと思われるなら、私はどんな種類の説明にも満足しています!
'のHadoop jar'は、MapReduceジョブを実行するために特別であるため、地図削減ジョブを作成します。 Pythonを使用してHDFS上のファイルを操作したいようですか?その場合はhttps://pypi.python.org/pypi/hdfs/ –