私は機能の妥当性を評価しようとしていると私は、コードの関連部分は以下の通りであるDecisionTreeRegressor()
DecisionTreeRegressorスコアの解釈?
を使用しています:私はprint
機能を実行すると
# TODO: Make a copy of the DataFrame, using the 'drop' function to drop the given feature
new_data = data.drop(['Frozen'], axis = 1)
# TODO: Split the data into training and testing sets(0.25) using the given feature as the target
# TODO: Set a random state.
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(new_data, data['Frozen'], test_size = 0.25, random_state = 1)
# TODO: Create a decision tree regressor and fit it to the training set
from sklearn.tree import DecisionTreeRegressor
regressor = DecisionTreeRegressor(random_state=1)
regressor.fit(X_train, y_train)
# TODO: Report the score of the prediction using the testing set
from sklearn.model_selection import cross_val_score
#score = cross_val_score(regressor, X_test, y_test)
score = regressor.score(X_test, y_test)
print score # python 2.x
、それは与えられたスコアを返します。
-0.649574327334
あなたがSCOを見つけることができます関数implementatioin以下here、以下、いくつかの説明RE:
決意R予測の^ 2の係数を返します。 ... 最高のスコアは1.0で、負の値になります( モデルは任意に悪化する可能性があるため)。
私はまだ全体のコンセプトを把握できませんでしたので、この説明はあまり役に立ちません。例えば、私はスコアが否定的な理由と正確に何が示されているのかを理解できませんでした(もし何かが二乗するなら、私はそれが肯定的でしかないと思うでしょう)。
このスコアは何を示していますか、それはなぜ否定的なのですか?
記事を知っていれば(初心者の方も)参考になるかもしれません!
スタート。 html –
係数の基礎を理解していれば、[this](https://stats.stackexchange.com/questions/183265/what-does-negative-r-squared-mean)と[that]( https://stats.stackexchange.com/questions/12900/when-is-r-squared-negative)。最初の記事は、しかし、背景の物語を理解するために完全に十分です。良いニュース、それはあまりにも初心者向けです! –