1
私はスカラのロジスティック回帰の例をhereから実行しています。トレーニング部において スパークマルチクラスロジスティック回帰クラス番号とラベル
:クラスの
val model = new LogisticRegressionWithLBFGS().setNumClasses(10).run(training)
数が私のデータは5、12および20である3枚のラベルから成る場合には10に設定されています。それは私が最も大きいクラスの値よりも大きなclassnum
を設定することによってそれを解決することができます知っているように
ERROR DataValidators: Classification labels should be in {0 to 9}. Found 6 invalid labels.
として例外が発生します。
ラベル値を明示的に変換せずに、このようなデータセットで実際の数のクラスでこのアルゴリズムを実行することはできますか?
classnum
を高くして動作させると、アルゴリズムは上記のような17のような存在しないクラスを予測しますか?