現在、Python APIはまだSpark内で複数クラスの分類をサポートしていませんが、Sparkページ1で説明されているように今後使用されます。Python APIを使用したロジスティック回帰マルチクラス分類
ロジスティック回帰で複数のクラスを実装するPythonでリリース日またはそれを実行する機会はありますか?私はそれがScalaであることを知っていますが、私はPythonでそれを実行したいと思います。ありがとうございました。
現在、Python APIはまだSpark内で複数クラスの分類をサポートしていませんが、Sparkページ1で説明されているように今後使用されます。Python APIを使用したロジスティック回帰マルチクラス分類
ロジスティック回帰で複数のクラスを実装するPythonでリリース日またはそれを実行する機会はありますか?私はそれがScalaであることを知っていますが、私はPythonでそれを実行したいと思います。ありがとうございました。
scikit-learn's LogisticRegressionは、multi_class
パラメータを提供します。ドキュメントから:
マルチクラスオプションは 'ovr'または 'multinomial'のいずれかです。 オプションが 'ovr'の場合、バイナリの問題は各ラベルに適合します。それ以外の場合、 損失最小化は、 確率分布全体にわたる多項式ロスフィットです。 'lbfgs'ソルバの場合にのみ動作します。
したがって、multi_class='ovr'
はあなたにとって正しい選択です。詳細については
を追加しました:
pysparkのドキュメントを1として、あなたはまだ彼らのAPIを使用したマルチクラス回帰を行うことができます。 pyspark.mllib.classification.LogisticRegressionWithLBFGS
クラスを使用すると、マルチクラス分類のためにオプションのパラメータnumClasses
が得られます。
scikit-learnとscala apiには、マルチクラスのLogisticRegressionもあります。これはPython開発者のPySpark APIに追加されますか?* –
編集された部分を参照 –
私はあなたの提案を試しました。このような問題に悩まされている場合は、[data science stackexchange](http://datascience.stackexchange.com/questions/13673/logistic-regression-as-multiclass-classification-using-pyspark-and-issues)でご質問ください。 )、私はあなたが私の問題を解決することを期待しています。 –