ダウンロードしないでs3バケットのファイルの内容を読む

awsとs3にはかなり新しいので、何も試していないようです。ディレクトリとファイルを走査し、ファイルを読み込み、一般にアクセス可能なs3バケットから特定の行を取得したい：s3://cgl-rnaseq-recompute-fixed/ダウンロードすることなく。私はちょうどファイルの内容のgrep/catのような基本的なタスクを実行できるようにしたいです。ダウンロードしないでs3バケットのファイルの内容を読む

s3バケット上のすべてのファイルとフォルダからMYCNを含む行を取得できるはずです。

これを行う最も効率的な方法は何ですか？ R/Pythonにs3バケットを横断するのに役立つパッケージがありますか？

ありがとうございます！

出典

2016-08-05 Komal Rathi

私はhttp://stackoverflow.com/a/38910315/2191173の答えが正確には、これはありません、どのようにそれ –

http://boto.readthedocs.io/en/latest/s3_tut.html

conn = boto.s3.connection.S3Connection(
     aws_access_key_id='xxx', 
     aws_secret_access_key='yyy' 
) 
for key in conn.list(prefix='logs/*.log'): 
    print key

出典

2016-08-05 18:56:47 ykhrustalev

そして、どのようにダウンロードせずに、ファイルの内容を読むためという疑問を解決だと思います質問に答えて？ –

ダウンロードしないでs3バケットのファイルの内容を読む

答えて

関連する問題