私は、オンデマンドのHDFSインストールで多数のデータを持っています。私はその一部をGoogle Cloud(Cloud Storage)に移行したいと思っていますが、いくつか懸念があります:オンデマンドHDFSのデータをGoogle Cloud Storageに安全に転送するにはどうすればよいですか?
- 実際にデータを移動するにはどうすればよいですか?
- 私は公共のインターネット
クラウドストレージへの私のHDFSストアからデータを安全に移動するための最良の方法は何の上に移動する心配?
私は、オンデマンドのHDFSインストールで多数のデータを持っています。私はその一部をGoogle Cloud(Cloud Storage)に移行したいと思っていますが、いくつか懸念があります:オンデマンドHDFSのデータをGoogle Cloud Storageに安全に転送するにはどうすればよいですか?
クラウドストレージへの私のHDFSストアからデータを安全に移動するための最良の方法は何の上に移動する心配?
オンプレミスHadoopクラスタからGoogle Cloud Storageにデータを移動するには、おそらくGoogle Cloud Storage connector for Hadoopを使用する必要があります。 install directionsに従って、任意のクラスターにコネクターをインストールできます。メモとして、Google Cloud Dataprocクラスタにはデフォルトでコネクタがインストールされています。
コネクタがインストールされたら、DistCpを使用して、HDFSからCloud Storageにデータを移動できます。これにより、Google Cloudとの特別なインターリンク設定がない限り、(公開)インターネット上のデータが転送されます。この目的のために、squid proxyを使用して、Cloud Storageコネクタto use itを設定することができます。