0
OracleとMysqlからデータを読み込みたい。次に、OracleとMysqlから読み込まれたデータを比較する必要があり、出力はMSSQLサーバーに格納されます。私はC#でMapReduceジョブを使用してこれをすべて実行したい。OracleとMySqlのデータを読み取るMapReduceジョブを作成できますか?
Hadoopマルチノードクラスタを構成し、MapReduceジョブを実行してOracleとMySQLからデータを読み取る場合、MapReduceが読み取るデータはクラスタ内の複数のノードのメモリに分散されます。
HDFSにデータを保存したくない場合は、何が選択肢ですか。 ? –
カスタムスパークジョブを作成します。 mysqlから読み込み、ビジネスロジックを適用して別のDBに書き込みます。すべてがSparkで起こり、間にHDFSはありません。 – KrazyGautam
sqoopやsparkを使用する代わりにMapReduceで同じことを実行できますか?私自身のMR仕事を書きたい –