OracleからCassandraへデータをETLプロセスの一部として毎日移行しています。両方のデータベースが同期していることを確認するために、Sparkジョブが完了したら、2つのデータベース間でデータ検証を実行したいと思います。私たちはDSE 5.1を使用しています。データが適切に移行されるように貴重な情報を提供してください。OracleからCassandraへのデータ検証データ移行
0
A
答えて
0
SparkのサポートでDSE Maxを使用していると仮定しました。 SparkSQLはスイートに最適です。あなたは私が何のオラクルDBので、次のコードをテストしないされていない持っているJDBC https://spark.apache.org/docs/2.0.2/sql-programming-guide.html#jdbc-to-other-databases でOracleに接続 まず、JDBC URLをチェックして、ドライバが前にそれを実行します。
dse spark --driver-class-path ojdbc7.jar --jars ojdbc7.jar
scala> val oData = spark.read
.format("jdbc")
.option("url", "jdbc:oracle:thin:hr/[email protected]//localhost:1521/pdborcl")
.option("dbtable", "schema.tablename")
.option("user", "username")
.option("password", "password")
.load()
C *データがすでにSparkSQLテーブルにマップされます。したがって:
scala> cData = spark.sql("select * from keyspace.table");
テーブルを適切に比較するには、両方のスキーマとデータ変換の詳細を確認する必要があります。シンプルな統合チェック:Oracleに存在するすべてのデータ・フォームは、C *に存在します。
scala> cData.except(oData).count
0: Long
関連する問題
- 1. MysqlからCassandraへのデータ移行
- 2. Pentahoを使用したSQL/OracleからCassandraへのデータの移動
- 3. AccessからSQLServerへのデータの移行
- 4. RDBMSからCassandraへの移行
- 5. Akka Persistence:jdbc(postgres)からcassandraへの移行
- 6. Oracle SQLのデータ移行
- 7. Oracleでのデータ移行
- 8. solrからelastic検索へのデータの移行
- 9. MySqlからMySqlへのデータ移行
- 10. NetezzaからSQL Serverへのデータ移行
- 11. teradataからbigqueryへのデータ移行
- 12. NetezzaからRedshiftへのデータ移行
- 13. Parseからback4Appへのデータ移行エラー
- 14. ZippedファイルからCassandraへのデータ
- 15. CassandraからTeradataへデータをロード
- 16. Cassandra 2.2.0からDSE 4.8.5への移行(Cassandra 2.1.3)
- 17. OracleからSQL Serverへのデータの移行エラー:値がNULLです
- 18. oracleからsql server 2008への移行
- 19. MySQLからOracleへの移行
- 20. OracleからMemSqlへの移行
- 21. Google Cloudへのデータ移行
- 22. JavaからのOracleデータ型へのアクセス
- 23. Cassandraテーブルへのデータのコピー
- 24. Oracle:移行中のデータの正規化
- 25. OracleからSQL Serverへのデータ
- 26. SQL Server 2008からOracle 11gにデータを移行/移行する方法は?
- 27. CassandraからMySQLにデータを移行するためのツールですか?
- 28. マルチノードカサンドラクラスタからシングルノードインスタンスへのデータ移動
- 29. sqlから弾性検索への移行後にsqlデータを使用して弾性検索データを検証する方法
- 30. SQL Server 2005でのデータ移行の検証