私はPythonでテキストファイルを処理するスクリプトをいくつか書いています。ローカルスクリプトは、私が一致する文字列を検索し、ファイル経由pythonを使ってテキストファイルのフォルダ内の文字列を検索する方法
index_file = open('index.txt', 'r')
for line in index_file:
....
とループを使用するため、単一のTXTファイルから読み込みますが、アマゾンEMRを使用した場合、index.txtのファイル自体は、複数のTXTファイルに分割されます1つのフォルダに保存します。
私はそれをローカルに複製し、特定の文字列の複数のtxtファイルから読み取るが、私はそれを行うためのクリーンなコードを見つけるのに苦労したいと思います。
最小限のコードを書いている最中にはどうすればいいですか?
os.walkを使用して、ディレクトリ内のすべてのファイルを取得し、それらをループして、各ファイルに一致する文字列ロジックを適用することができます。 – pmaniyan