-3
こんにちは、私は、Apacheの新しい学習者です。 これは正しい方法ですか? このコードは動作していますが、パフォーマンスは非常に低速です。どのループが各ループのデータにアクセスするのに最適なアプローチか分かりません。Apache-Spark-SQLを使用してデータベースにアクセス
Dataset<Row> javaRDD = sparkSession.read().jdbc(dataBase_url, "sample", properties);
javaRDD.toDF().registerTempTable("sample");
Dataset<Row> Users = sparkSession.sql("SELECT DISTINCT FROM_USER FROM sample ");
List<Row> members = Users.collectAsList();
for (Row row : members) {
Dataset<Row> userConversation = sparkSession.sql("SELECT DESCRIPTION FROM sample WHERE FROM_USER ='"+ row.getDecimal(0) +"'");
userConversation.show();
}
ループの繰り返しごとにクエリを実行しています。それはいつも遅くなるでしょう。 – Kayaman
thnx、スパークコードを使用してアクセスする他の方法はありますか?もちろん、 – saara
。物事を行う唯一の方法が遅い方法と悪い方法であれば、それはあまり有用ではありません。 – Kayaman