私の用語を許して、私はMLプロではありません。私は以下の誤った用語を使用するかもしれません。scikit-learnで多変数線形回帰を実行するには?
私は多変数線形回帰を実行しようとしています。 Webサイトのページビューを分析してユーザーの性別を調べようとしているとします。
性別が、私が知っている、私はそれぞれの行は、Webサイトのセクションを表し機能行列を持っており、彼らはそれを訪問したかどうか、第2の要素、例えば、各ユーザの場合:
male1 = [
[1, 1], # visited section 1
[2, 0], # didn't visit section 2
[3, 1], # visited section 3, etc
[4, 0]
]
のでscikitで、私は建物xs
およびys
。私は1として、男性を表す、と女性0
は、上記のように表現されるようにしています:
今features = male1
gender = 1
、私は明らかにだけではなく、単一のユーザーのためのモデルのトレーニングではなく、よ私はトレーニングのために使用しているデータが何万人もいるユーザーがいます。
私は次のように私は私のxs
と
ys
を作成する必要があります考えているだろう
:
from sklearn import linear_model
clf = linear_model.LinearRegression()
clf.fit(xs, ys)
それは文句:
ValueError: Found array with dim 3. Estimator expected <= 2.
どう
xs = [
[ # user1
[1, 1],
[2, 0],
[3, 1],
[4, 0]
],
[ # user2
[1, 0],
[2, 1],
[3, 1],
[4, 0]
],
...
]
ys = [1, 0, ...]
scikitがこれを好きではありません私は線形回帰アルゴリズムに特徴行列をscikit-learn?