-1
私は、テキストファイルと配列からRDDを構築することができますが、データベースはどうですか?Apache Sparkでは、データベース(MySQL、MongoDBなど)からRDDを構築できますか?
私は、テキストファイルと配列からRDDを構築することができますが、データベースはどうですか?Apache Sparkでは、データベース(MySQL、MongoDBなど)からRDDを構築できますか?
はい、HadoopがHadoop InputFormatとOutputFormat、およびhadoopRDD
メソッドを使用して作成したものだけに接続できます。データソースのほとんどはspark-packages(たとえばMongoDb)で既に完了しています。または、jdbc
をthis answer points out
として使用することができます。私の考えでは、上記のコメントの質問で指摘されているように、JDBCで読むのが最善の方法です。そうすれば、あなたのデータでDataFrameが作成されるので、RDDに変換するには '.rdd'を呼び出します。 –