に一致するS3バケット内のファイルは、私は以下のようなコマンドを使用して、私のR・マシンにS3バケットからファイルをコピーするためにAWS CLIを使用しているコピーするAWS CLIを使用する方法:のみ与えられた文字列パターン
system(
"aws s3 cp s3://my_bucket_location/ ~/my_r_location/ --recursive --exclude '*' --include '*trans*' --region us-east-1"
)
これは期待どおりに動作します。つまり、my_bucket_location内のファイル名に "trans"が含まれるすべてのファイルがその場所にコピーされます。
私が直面している問題は、この手順でインポートしたくない同様の命名規則を持つ他のファイルがあることです。私はだけでなく、最後の2、最初の2つのファイルをコピーしたいの下に一例として、リストに:
File list
trans_120215.csv
trans_130215.csv
sum_trans_120215.csv
sum_trans_130215.csv
私は正規表現を使用していた場合、私はちょうど最初の二つの中に持って"^trans_\\d+"
のようなことが、より具体的にすることができファイルを作成できますが、これはAWS CLIを使用しては不可能と思われます。ですから、私の質問は、以下のようなAWS CLIを使用してより複雑なパターンマッチングを行う方法ですか?
system(
"aws s3 cp s3://my_bucket_location/ ~/my_r_location/ --recursive --exclude '*' --include '^trans_\\d+' --region us-east-1"
)
私は他の不要なファイルが起動時にsum_含むという事実を使用することはできません、私はパターン"^trans_\\d+"
でファイルをインポートすること、すなわち、私が唯一の問題でファイルの情報を使用することができることに注意してくださいこれは単なる例であり、 "check_trans_120215.csv"のような類似の名前を持つ他のファイルが存在する可能性があるためです。
私は以下のような他の選択肢を検討し、これらの経路のいずれかを下って行く避けるために、コピーコマンドを調整する方法がある願っています
- Rの中で正規表現を使用して>バケット内のすべての項目を一覧表示それだけは>あなたが列挙されている
ああ、それは残念です。情報のおかげで –