2016-08-05 18 views
0

awsとs3にはかなり新しいので、何も試していないようです。ディレクトリとファイルを走査し、ファイルを読み込み、一般にアクセス可能なs3バケットから特定の行を取得したい:s3://cgl-rnaseq-recompute-fixed/ダウンロードすることなく。私はちょうどファイルの内容のgrep/catのような基本的なタスクを実行できるようにしたいです。ダウンロードしないでs3バケットのファイルの内容を読む

s3バケット上のすべてのファイルとフォルダからMYCNを含む行を取得できるはずです。

これを行う最も効率的な方法は何ですか? R/Pythonにs3バケットを横断するのに役立つパッケージがありますか?

ありがとうございます!

+0

私はhttp://stackoverflow.com/a/38910315/2191173の答えが正確には、これはありません、どのようにそれ –

答えて

0

http://boto.readthedocs.io/en/latest/s3_tut.html

conn = boto.s3.connection.S3Connection(
     aws_access_key_id='xxx', 
     aws_secret_access_key='yyy' 
) 
for key in conn.list(prefix='logs/*.log'): 
    print key 
+0

そして、どのようにダウンロードせずに、ファイルの内容を読むためという疑問を解決だと思います質問に答えて? –

関連する問題