sqoopは、テーブル主キーまたは--split-by <columns>
を使用してRDBMSからHDFSに転送します。デフォルトのマッパー数は4であると思います。しかし、--direct
によって、マッパーを使わずに転送を高速化することができます。私の質問は、マッパーが使用されていない場合、SqoopがHadoopフレームワークでの転送をどのように処理できるかです。どのようにダイレクトモードがsqoopで動作していますか?
0
A
答えて
1
、sqoop docsあたりとしてMySQLダイレクトコネクタは、より速くインポートおよびエクスポートに/ MySQLのから代わりにSQLの選択および挿入のmysqldump
とmysqlimport
ツールの機能を使用できます。
通常、JDBC経由で複数のマッパーを使用して範囲クエリを実行するよりも高速です。
0
ツールを使用して内部で--direct
引数を持つSqoopツールを使用してMySQLからデータをインポートします。 mysqldumpは、基本的にはMySQLの組み込みのエクスポートツールであるか、データベースのバックアッププログラムとも言えます。このユーティリティは論理バックアップを実行し、元のデータベースオブジェクト定義とテーブルデータを再現するために実行できる一連のSQL文を生成します。 mysqldump
コマンドは、CSV、その他の区切り文字付きテキスト、またはXML形式で出力を生成することもできます。
区切り文字がmysqldumpで使用される区切り文字と完全に一致する場合、Sqoopはmysqldumpの出力からHDFSに直接データをコピーするファストパスを使用します。それ以外の場合、Sqoopはmysqldumpの出力をフィールドに解析し、ユーザ指定のデリミタセットにトランスコードします。これにより追加の処理が行われるため、パフォーマンスが低下する可能性があります。便宜上、--mysql-delimiters
引数は、すべての出力区切り文字がmysqldumpの形式と一致するように設定します。
このリンクは、詳細を理解するのに役立ちます。
http://archive.cloudera.com/docs-backup/sqoop/_direct_mode_imports.html https://dev.mysql.com/doc/refman/5.7/en/mysqldump.html
関連する問題
- 1. Sqoop appendコマンドはhadoopでどのように動作するのですか
- 2. Jqueryはどのように動作していますか?
- 3. mvc4バンドル、どのように動作していますか?
- 4. どのようにコントローラがasp.net mvcで動作しますか?
- 5. どのようにソートが動作するのか理解しています
- 6. Meteorはどのように動作しますか?クライアントとサーバーはどのように動作しますか?
- 7. どのようにポートスキャナが動作しているかどうかを確認できますか?
- 8. ダイレクトモードでキャプチャフレーム(Nvidia)
- 9. LINQ IEnumerableはどのようにして動作しますか?
- 10. Hibernateコールセパレーションジェネレータはどのようにして動作しますか?
- 11. HTMLファイルでCSSが動作していないようです。どうして?
- 12. データフローによってAfterProcessingTime.pastFirstElementInPane()がどのように動作しますか?
- 13. Sqoopコマンドフィールド終了ライン終了が色相から動作していません
- 14. jqueryデモが動作していない、どのように?
- 15. 次のコードで、row_string = ""はどのように動作していますか?
- 16. Sqoop "create-hive-table"がHortonworksのTeradataで動作しない
- 17. オートプレフィクサーが動作しているかどうかをテストするにはどうすればよいですか?
- 18. バンドルがうまく動作していないようです
- 19. symfony3を使って "{%use%}"が枝でどのように動作しますか?
- 20. Pyasn1どのようにdecoder.decodeが動作しますか?
- 21. スクリプトがサブディレクトリ内で動作するかどうかをどのように知っていますか?
- 22. 複合IDはどのようにループバックで動作していますか?
- 23. カサンドラとセカンダリインデックスは、内部でどのように動作していますか?
- 24. solrは "catch-all"フィールド_text_でどのように動作していますか?
- 25. 他のウィジェットが望んでいないキーボードイベントに対してのみ、どのように動作しますか?
- 26. CSSがサブドメインで動作していないようですか?
- 27. 増分 "lastmodified"がsqoopで動作しない
- 28. SqoopジョブがHadoop Credential APIで動作しない
- 29. angular $ injectがバックグラウンドでどのように動作しているか