に不一致を予測する私はMLとsklearnに比較的新しいですし、私は6つの別の特徴は、正則化パラメータの異なる値でlinear_model.Lassoを使用して、入力データのための線形モデルを訓練しようとしています。私はこれらの2式を実行することによって、異なる値を得続ける理由XとYがモデルのための私の入力パラメータであることを考えると、私は理解することはできません。Sklearnモデル係数とlinear_model
sum(model.coef_*X[0])
Out[94]: -0.4895022980752311
model.predict(X[0])
Out[95]: array([ 2.08767122])
理想的には私がいることを期待しますモデル係数はデータセット内の特定のフィーチャに対応し、両方の式がまったく同じ値を返すことになります。ここで
はコードのサンプルです:
input_file = 'Spud_startup_analysis.xlsx'
data_input_generic = pd.read_excel(input_file, skiprows = 0, sheetname='DataSet')
data = data_input_generic.as_matrix()
X = data[:, 0:-1]
y = data[:,-1]
model = linear_model.Lasso(alpha = 0.1)
model.fit(X, y)
それは、入力行列の大きさとは何かを持っているのでしょうか? ありがとうございます
ああ... X_0係数。絶対に。どうもありがとう –