2017-09-19 11 views
0

私は、オンデマンドのHDFSインストールで多数のデータを持っています。私はその一部をGoogle Cloud(Cloud Storage)に移行したいと思っていますが、いくつか懸念があります:オンデマンドHDFSのデータをGoogle Cloud Storageに安全に転送するにはどうすればよいですか?

  • 実際にデータを移動するにはどうすればよいですか?
  • 私は公共のインターネット

クラウドストレージへの私のHDFSストアからデータを安全に移動するための最良の方法は何の上に移動する心配?

答えて

2

オンプレミスHadoopクラスタからGoogle Cloud Storageにデータを移動するには、おそらくGoogle Cloud Storage connector for Hadoopを使用する必要があります。 install directionsに従って、任意のクラスターにコネクターをインストールできます。メモとして、Google Cloud Dataprocクラスタにはデフォルトでコネクタがインストールされています。

コネクタがインストールされたら、DistCpを使用して、HDFSからCloud Storageにデータを移動できます。これにより、Google Cloudとの特別なインターリンク設定がない限り、(公開)インターネット上のデータが転送されます。この目的のために、squid proxyを使用して、Cloud Storageコネクタto use itを設定することができます。

関連する問題