-1

私は機能の妥当性を評価しようとしていると私は、コードの関連部分は以下の通りであるDecisionTreeRegressor()DecisionTreeRegressorスコアの解釈?

を使用しています:私はprint機能を実行すると

# TODO: Make a copy of the DataFrame, using the 'drop' function to drop the given feature 
new_data = data.drop(['Frozen'], axis = 1) 

# TODO: Split the data into training and testing sets(0.25) using the given feature as the target 
# TODO: Set a random state. 

from sklearn.model_selection import train_test_split 


X_train, X_test, y_train, y_test = train_test_split(new_data, data['Frozen'], test_size = 0.25, random_state = 1) 

# TODO: Create a decision tree regressor and fit it to the training set 

from sklearn.tree import DecisionTreeRegressor 


regressor = DecisionTreeRegressor(random_state=1) 
regressor.fit(X_train, y_train) 

# TODO: Report the score of the prediction using the testing set 

from sklearn.model_selection import cross_val_score 


#score = cross_val_score(regressor, X_test, y_test) 
score = regressor.score(X_test, y_test) 

print score # python 2.x 

、それは与えられたスコアを返します。

-0.649574327334

あなたがSCOを見つけることができます関数implementatioin以下here、以下、いくつかの説明RE:

決意R予測の^ 2の係数を返します。 ... 最高のスコアは1.0で、負の値になります( モデルは任意に悪化する可能性があるため)。

私はまだ全体のコンセプトを把握できませんでしたので、この説明はあまり役に立ちません。例えば、私はスコアが否定的な理由と正確に何が示されているのかを理解できませんでした(もし何かが二乗するなら、私はそれが肯定的でしかないと思うでしょう)。


このスコアは何を示していますか、それはなぜ否定的なのですか?

記事を知っていれば(初心者の方も)参考になるかもしれません!

+0

スタート。 html –

+0

係数の基礎を理解していれば、[this](https://stats.stackexchange.com/questions/183265/what-does-negative-r-squared-mean)と[that]( https://stats.stackexchange.com/questions/12900/when-is-r-squared-negative)。最初の記事は、しかし、背景の物語を理解するために完全に十分です。良いニュース、それはあまりにも初心者向けです! –

答えて

0

DecisionTreeRegressorが実装されたcross_val_scoreを実行します。 scikitlearn DecisionTreeRegressorのドキュメントをご覧ください。 基本的に、あなたが見るスコアはR^2、または(1-u/v)です。 Uは予測の平方和残差であり、vは総二乗和(平方のサンプル和)です。

あなたが本当に悪い予測を行うときにのみ、uとvは二乗残差の和である与えられたゼロな限り小さくすることができますしながら、U/Vは、大規模な任意である(> = 0)

1

R^2から否定することができそのモデルが水平線より悪いデータに適合する場合、その定義(https://en.wikipedia.org/wiki/Coefficient_of_determination)。基本的には

R^2 = 1 - SS_res/SS_tot 

SS_resSS_totは常に正です。 SS_res >> SS_totの場合は、負の値R^2があります。同様に、この答えを見てください:https://en.wikipedia.org/wiki/Coefficient_of_determinationとhttp://scikit-learn.org/stable/modules/generated/sklearn.metrics.r2_score:とhttps://stats.stackexchange.com/questions/12900/when-is-r-squared-negative