私は、pysparkと、scikit-learnとpysparkを統合する可能性を模索しています。 scikit-learnを使って各パーティションのモデルを訓練したいと思います。つまり、自分のRDDが定義されていて、異なるワーカーノードに分散されている場合、私はscikit-learnを使い、各ワーカーノードに存在する各パーティションでモデル(単純なk-meansと呼ぶ)を訓練したいと考えています。 scikit-learnアルゴリズムがPandasデータフレームを取るので、最初の考えはtoPandas
を各パーティションに呼び出して、モデルを訓練することでした。しかし、toPandas
関数はDataFrameをドライバに集めますが、これは私が探しているものではありません。そのような目標を達成する他の方法はありますか?scikit-learnとpysparkを統合する
答えて
scikit-learnは今のところ完全にsparkと統合できません。なぜなら、scikit-learnアルゴリズムは1台のマシン上で動作するように分散されて実装されていないからです。
しかし、spark-sklearnのSpark-Scikit統合ツールを使用すると、相互検証のためにSparkでGridSearchを実行する(瞬時に)サポートされます。
任意のモデルを実行したいのですが?各パーティションでkmeansを実行してみましょう。それはspark-sklearnでサポートされていますか? –
このライブラリは、前回チェックしたばかりの分散グリッド検索をサポートしています。それは今の場合のように見えます。残念ながら、アルゴリズムの配布は単なるプラグアンドプレイではなく、非常に簡単でした。 Sklearnがsparkでこれらのアルゴリズムを直接実装しない限り、それを簡単に統合することはできません。 – eliasah
- 1. Scikit-learnとpysparkの統合
- 2. CassandraとSpark(pyspark)との接続/統合
- 3. PySpark SQL:.withColumnコールの統合
- 4. jupyterノートブックにpysparkを統合する方法
- 5. Scikitlearn - クロスバリデーション
- 6. ScikitLearnランダムフォレストのアンダーサンプリングとクラスウェイト
- 7. Kivy Android Scikitlearn
- 8. SciKitLearnツリーがエラーを返す
- 9. 郵便受け統合テストとTeamCityを統合するには
- 10. IBM統合バスとIBMプロセス・デザイナーを統合する方法
- 11. Spring統合とSpring MVCの統合
- 12. ストラクチャードストリーミング+カフカ統合 - SSLとKerberosの統合?
- 13. Python SciKitLearn and Pandasカテゴリデータ
- 14. STSとSpringの統合複数のxmlファイルと統合された統合グラフ
- 15. データ統合とサービス統合がそれぞれビジネスワークフローに適合する場合
- 16. Pyspark - タイムスタンプ値とタイムスタンプ値との結合
- 17. RelayJSとAzureテーブルストレージを統合する
- 18. ASP.NET MVCとMVVMを統合するアプリケーションフレームワーク
- 19. コードワインプラグインをpaypal with ionicと統合する
- 20. wso2アイデンティティサーバーとAPIマネージャを統合する
- 21. C#(VS2010)とUnity Engineを統合する
- 22. Chromeをコマンドラインツールと統合する
- 23. cakephpとmagentoを統合するには?
- 24. NetsuiteとPHPを統合するには
- 25. Eclipseとarcanistを統合する
- 26. wowbookとionicを統合する
- 27. セレンとZAPを統合する方法
- 28. 別のダッシュボードをuserFrostingと統合する
- 29. FirebaseとBraintreeを統合する
- 30. githubとOpenshiftを統合する
どういうわけか、各パーティションをデータフレームに変換して配列のような構造にすることができれば、それは可能でしょうか? –
各パーティションでモデルを計算することはどのように関連するのかわかりません。それはどういう意味ですか?実際には、どのようにモデルを組み立てますか? – eliasah
だから、各パーティションでkmeansを実行したら、何とかすべての重心点をドライバに転送する必要があります。これはおおよそのk平均のようなものです。しかし、今重心点を運転手に転送する方法はわかりません。何か案が? –