2017-02-06 14 views
0

私は1ギガバイト程度の大規模なデータセットを取得しようとしていますし、私は主に大規模なデータセットが https://aws.amazon.com/datasets/google-books-ngrams/ などのアマゾンウェブサービスであることを発見し、データがアマゾンからAWS

S3利用可能であると述べているが、データセットをダウンロードする方法: //datasets.elasticmapreduce/ngrams/books/

このデータをダウンロードしようとしています。この目的のために、AWSに仮想マシンを作成しました。この2GBのデータをAWSにダウンロードするにはどうしたらいいですか?後で私はローカルマシンにscp経由で転送できますか?

+1

これらのファイルはS3にあります。それらをダウンロードするだけでAWSにサーバーを作成する必要はありませんでした。 AWS CLIツールをインストールし、それをダウンロードします。 –

答えて

1

マークBがコメントしたように、これらのデータセットをダウンロードするには、AWSのサーバーをスピンアップする必要はありません。彼らは公にS3でホストされているので、あなたが実行して、ローカルマシンにダウンロードするAWS S3 CLIのcpツールを使用することができます。

aws s3 cp --recursive s3://datasets.elasticmapreduce/ngrams/books/ local 

関連ドキュメントはhereを見つけることができます。

関連する問題