2016-08-09 12 views
1

現在、Python APIはまだSpark内で複数クラスの分類をサポートしていませんが、Sparkページ1で説明されているように今後使用されます。Python APIを使用したロジスティック回帰マルチクラス分類

ロジスティック回帰で複数のクラスを実装するPythonでリリース日またはそれを実行する機会はありますか?私はそれがScalaであることを知っていますが、私はPythonでそれを実行したいと思います。ありがとうございました。

答えて

3

scikit-learn's LogisticRegressionは、multi_classパラメータを提供します。ドキュメントから:

マルチクラスオプションは 'ovr'または 'multinomial'のいずれかです。 オプションが 'ovr'の場合、バイナリの問題は各ラベルに適合します。それ以外の場合、 損失最小化は、 確率分布全体にわたる多項式ロスフィットです。 'lbfgs'ソルバの場合にのみ動作します。

したがって、multi_class='ovr'はあなたにとって正しい選択です。詳細については

see this link


を追加しました:

pysparkのドキュメントを1として、あなたはまだ彼らのAPIを使用したマルチクラス回帰を行うことができます。 pyspark.mllib.classification.LogisticRegressionWithLBFGSクラスを使用すると、マルチクラス分類のためにオプションのパラメータnumClassesが得られます。

+0

scikit-learnとscala apiには、マルチクラスのLogisticRegressionもあります。これはPython開発者のPySpark APIに追加されますか?* –

+1

編集された部分を参照 –

+0

私はあなたの提案を試しました。このような問題に悩まされている場合は、[data science stackexchange](http://datascience.stackexchange.com/questions/13673/logistic-regression-as-multiclass-classification-using-pyspark-and-issues)でご質問ください。 )、私はあなたが私の問題を解決することを期待しています。 –

関連する問題