毎月私はCSVファイルを受け取ります.2GBサイズです。私はこのファイルをMySqlデータベースのテーブルにインポートしますが、これはほぼ即時です。ハドープ開始ポイント
PHPを使用してこのテーブルにクエリを行い、このテーブルのデータをフィルタ処理し、関連するデータをいくつかの他のテーブルに書き出します。これは数日間かかるため、すべてのクエリが最適化されます。
このデータをHadoopに移動したいが、何を出発点にすべきか理解していない。私はHadoopを勉強していますが、これはSqoopを使って行うことができますが、このデータをHadoopに移行する方法についてはどこから始めるべきか、まだ分かりません。
これをHDFSに移行する目的は何ですか? – franklinsijo
サイズは日々大きくなり、処理には数日かかる。 – phpMax