これには既存のAPI機能があると思います。このようになりますJavaコードがあったとします。このApache Spark JavaRDDを使用してMongoDBでどのようにクエリを実行しますか?
JavaRDD<Integer> queryKeys = ...; //values not particularly important
List<Document> allMatches = db.getCollection("someDB").find(queryKeys); //doesn't work, I'm aware
JavaPairRDD<Integer, Iterator<ObjectContainingKey>> dbQueryResults = ...;
は目標:データ変換の束の後、私は私が持つ単一のDBクエリをしたいのですが整数キーのRDDで終わります(一連のクエリではなく)このキーのコレクションに基づいています。
そこから、クエリ結果をキーのRDDとイテレータのすべての結果のペアに変換したいと思います(次のステップのために再び地面に向かうことが容易になります)取る)。そして明確にするために、私はイテレータとしてキーとその結果のペアを意味します。
私はSparkとコーディネートできるMongoDBの機能があることは知っていますが、まだこれで動作するものは見つかりませんでした。(クエリではなくデータベースに書き込む傾向があります)
RDDをマッピングしてMongoDBをクエリすることができます –
ええ、それはかなり普通です。 –