OracleからHadoopへのデータ取り込みにSqoopを使用しましたが、うまくいきました。 Sqoop上のパーティションを使用せずにOracleからHiveテーブルに8,600万レコードを持ち込むのにわずか4分しかかかりませんでした。誰でもOracle Hadoopコネクタに関する詳細を提供できますか?Sqoopよりも優れた性能を発揮しますか?Oracle Hadoop Connectors対Sqoop
1
A
答えて
0
ほとんどのコネクタは、ワークフローの終わりにMapReduceジョブを設定した場合とほぼ同じパフォーマンスを発揮しますが、これは全体的なパフォーマンスの主な役割を果たすでしょう。
その後、あなたはSqoopで見るOracleはハイブにアクセスするための異なるコネクタのセットを提供し、標準溶液についての素晴らしい概要をチェックすることができますが、私は最後の最後に、あなたが他の重要なパフォーマンスの違いを期待することを疑う:
https://docs.oracle.com/cd/E37231_01/doc.20/e36961/start.htm#BDCUG119
Sqoopは、Hadoop領域のリレーショナルデータベースを操作するための一般的なツールであり、Oracleだけに制限されません。それに加えて、複雑なワークフローを作成するためのOozieのような他のHadoopソリューションとの統合もあり、他のタイプのコネクタより優れた候補になります。
個人的に私は、Hadoopでインポートされたインポート/エクスポート操作と、Hadoopのデータをクエリするためのコネクタアプローチの方がSqoopよりも好きです。
0
Sqoopは標準のJDBC接続を利用します。 Oraclesコネクタは、sqoop接続に統合されたfastloader/fastexportクラスで動作します。それはSqoopより速いはずです。
関連する問題
- 1. Sqoopを使用してOracleデータをHadoopにロードする
- 2. sqoopコマンドでHadoopユーザを設定する
- 3. JDBC-ORACLE接続タイムアウトパラメータ(Sqoop用)
- 4. Sqoop oracle接続の問題
- 5. Sqoop - 日付 - タイムスタンプ
- 6. Java対Python on Hadoop
- 7. Sqoop Oracleインポートでテーブルが作成されない
- 8. sqoop not import datatype varchar2
- 9. cloudera hadoop UIを使用してsqoopインクリメンタルを自動化
- 10. Hadoop 2.8.1 Sqoop 1.4.6 SQL Serverデータからのインポートの問題?
- 11. SqoopジョブがHadoop Credential APIで動作しない
- 12. Sqoopは、私はHadoopのに新しいですエラー
- 13. Sqoopインポートが
- 14. Sqoopエラーは、Oracle DBからデータをフェッチするために、このsqoopコマンドを使用しますが、以下のエラーで終わるOracleウォレットに
- 15. Sqoopインポートの問題
- 16. DBベンチマーク:Hadoopの対BigTableの対カサンドラ(S)
- 17. sqoop import-all-tables fail
- 18. SparkでHadoop Credential providerを使用してOracleデータベースに接続する方法は?
- 19. EC2対ElasticMapReduce/S3のHadoop
- 20. Hadoop入力分割対ブロック
- 21. Sqoop with query clause
- 22. sqoopを使用してOracle(Windows)からHDFS(CDH3)マシンにデータをインポート
- 23. コネクタjarファイル内のsqoop oracle buitの名前は何ですか?
- 24. Sqoopインポートに失敗しました
- 25. Sqoop 1.99.7 Centos 7へのインストール
- 26. RDBMSからSqoopなしでhadoopにデータを移動するには?
- 27. スパークジョブがあるとACCEPTEDでHadoop - Sqoopジョブが実行されるRUNNING
- 28. Sqoopを使ってmysqlからHadoopにデータをインポートしても失敗する
- 29. Apache Hadoop 2.7.1はApache Sqoop 1.4.6と互換性がありますか?
- 30. 誰もhadoop、sqoop、hbase、ハイブの互換性バージョンを提案できます
Oracleのドキュメントに従って:Oracle Loader for Hadoopは、データを前処理するためにHadoopクラスタ上で実行されるMapReduceプログラムです。ロードの準備として、データをOracleデータ型に分割、ソート、変換することができます。これにより、データベース・サイクルがHadoopにオフロードされるため、ロード中にデータベースCPUが少なくなります。オンラインモードでは、前処理されたデータがデータベースに直接ロードされます。オフライン・モードでは、Oracle Loader for Hadoopは、事前処理されたデータをHDFS上のデータ・ポンプ・ファイルとして書き出します。オンラインモードには、JDBCとダイレクトパスという2つの負荷オプションがあります。 –