SQL Serverには5分ごとに更新されるPLCデータがあります。 同じ時間間隔でクロウダ分布のHDFSにデータをプッシュする必要があります。 これに使用できるツールはどれですか?クローダのSQL SERVERからHDFSへのほぼリアルタイムのデータ取り込み
答えて
この作業には、Confluent Kafkaを使用することをお勧めします(https://www.confluent.io/product/connectors/)。
アイデアは以下の通りである:
のSQLServer - > [JDBC-コネクタ] - >カフカ - > [HDFS-コネクタ] - > HDFS
これらのすべてのコネクタがすでに経由で利用可能ですがコンフルエントなウェブサイト。
ありがとう..それを試してください。 – Soz
あなたのデータがローカルFSのいくつかのディレクトリに書き込まれていると仮定しています。この作業には、ストリーミングエンジンを使用することができます。 apache-spark
というタグが付いているので、私はあなたにSpark Streamingソリューションを提供します。
ストリーミングコンシューマは、構造化ストリーミングを使用して、データディレクトリを監視します。スパークストリーミングは、設定可能なマイクロバッチ(ストリーム待機時間)でデータを読み取り、処理します。これは、あなたのケースでは5分です。各マイクロバッチのデータを保存用のcloudera hadoopクラスタを使用するテキストファイルとして保存することができます。
これが役立ったかどうか教えてください。乾杯。
:ありがとうございました。私たちはSQL Serverからデータを読み込まなければなりません。データはFSにプッシュされません。この場合、ストリーミング・ヘルプを起動できますか? – Soz
はいjdbcを使用すると、sparkの任意のデータソースから読み取ることができます。 –
sqoopという名前のツールをGoogleに送信できます。オープンソースのソフトウェアです。
私はSqoopをバッチ処理のように使いました。しかし、私はSQL Serverからリアルタイムでデータを取り込む必要があります。 – Soz
- 1. hdfsからハイブへのCsvファイルの取り込み
- 2. SharePointからSQL Serverへのリアルタイム同期
- 3. hdfsからの読み取りとOracleへの書き込み12
- 4. Oracle DBからBigQueryへのほぼリアルタイムのデータフローを実現する方法は?
- 5. ほぼリアルタイムのETLアーキテクチャ用の右ツール
- 6. SQL ServerからC#へのVARBINARY(MAX)の読み取り
- 7. MySQLからレッドシフトに近いほぼリアルタイムのETL
- 8. hdfsからsqlへデータを移動
- 9. SQLレプリケーションのセットアップ - ほぼあります。
- 10. MongoDbリアルタイムで(またはほぼリアルタイムで)挿入されたデータをストリーミング
- 11. ほぼリアルタイムでRSSフィードをリフレッシュ
- 12. シリアルポートからのデータの読み取りとリアルタイムでのプロット
- 13. ハイチャートとほぼほぼ一定の時間間隔のデータ
- 14. AccessからSQL Serverへのデータのリンク
- 15. SAPからSQL Serverへのデータのエクスポート
- 16. iPhoneからのほぼリアルタイムビデオアップロード
- 17. NetezzaからSQL Serverへのデータ移行
- 18. OracleからSQL Serverへのデータ
- 19. SQL ServerからMySQLへのデータ転送
- 20. SQL ServerからMySQLへのデータ転送
- 21. ほぼリアルタイムのオートメーションサーバーをプッシュまたはプルしますか?
- 22. Spark/ScalaのHDFSへの書き込み
- 23. Pythonのhdfsファイルへの書き込み
- 24. SQL SERVER DBの所有者とほぼ同じ、実行、読み取り、書き込み権限を持つアカウントですか?
- 25. ステージステージ1:HDFS読み取り:0 HDFS書き込み:0 FAIL
- 26. SSIS - SQL Server 2000からSQL Server 2012へのデータ転送
- 27. hdfsからmongodbへのデータのエクスポート
- 28. モバイルイベントデータをhdfsに取り込みます
- 29. Firebaseリアルタイムのアンドロイドからウェブアプリケーションへのデータの取得方法
- 30. データを読み込む問題hdfsからのハイブで
PLCとHDFSは何ですか? – ibubi
PLCはプログラマブルロジックコントローラの略です。 HDFSはhadoop分散ファイルシステムです。 –