Spark Streamingを使用して、HDFSの寄木細工ファイルをMS SQL Serverにコピーしようとしています。 MS SQL Server用のJDBCドライバを使用しています。 私のコードは次のとおりです。Structured Streamingを使用してparquetファイルをHDFSからMS SQL Serverにコピーする方法?
val spark = SparkSession.builder().master("yarn").appName("StreamAFile").getOrCreate();
val userSchema = new StructType().add("mandt","string").add("lifnr","string").add("land1","string").add("name1","string").add("name2","string");
val myDF = spark.readStream.format("parquet").schema(userSchema).load("/parquetfilepath/*");
val query = myDF.writeStream.format("jdbc").option("driver","net.sourceforge.jtds.jdbc.Driver").option("dbtable","mytable").option("user","username").option("password","password").option("checkpointLocation","/homedirectory/").start("jdbc:jtds:sqlserver://SQLServer1:1433;DatabaseName=MyDB");
私はエラーを取得しています:誰もがこの前に働いていた場合
java.lang.UnsupportedOperationException: Data source jdbc does not support streamed writing
は修正してください。エラーとして
ありがとうございます。私が構造化ストリーミングを使用していた理由は、リアルタイムでデータをSQL Serverにコピーすることです。私はバッチSparkアプリケーションが並列ではなく順次実行することを期待しています。 –
ストラクチャードストリーミングについても同様です(バッチ指向のままです)。そういうわけで私はいくつかの選択肢を提案することにとても熱心でした。 _魔法はありません –