2016-11-13 11 views
0

私はこの問題で少し困っています。リストのリストを作成しました。これはnumpyの配列をXに格納するために渡されます。各サブリストはサンプルのフィーチャーです(各列の現在の値は私は各特徴を整数にまだ解析していない)。次に、numpy.fillでy変数をテスト用に同じ値で作成しました。結果として得られる出力は、ジニ値0と1ノード決定木であるしかし、私はX =Scikit-learn 1ノード決定木?

array([[ 0, 1, 2, ..., -1, -1, -1], 
    [ 0, -1, 2, ..., -1, -1, -1], 
    [ 0, -1, -1, ..., -1, -1, -1], 
    ..., 
    [ 0, -1, -1, ..., -1, -1, -1], 
    [ 0, -1, -1, ..., -1, -1, -1], 
    [ 0, -1, 2, ..., -1, -1, -1]]) 

およびy =

[4 4 4 ..., 4 4 4] 

(X、Y)を適合するように、これらの2つのnumpyのアレイに通しますよなぜ誰かがこのことが起こっているかもしれないのかどうかを明らかにすることができるかどうか分かります。ありがとう!

+0

データに機能があることが保証されていないので、-1で各アレイをパディングしましたが、配列を代用する方法を理解する必要があります(これは私の質問に対する答えかもしれません) –

答えて

1

私が目標値を理解したものは、すべてのサンプルで4です。ツリーにはノードが1つしかないと仮定します。これは、すべてのトレーニングデータの目標値が4であるため、テストデータの目標値を4と予測します。また、すべてのサンプルが同じクラスにあるので、gini indexも0です。それが役に立てば幸い !

+0

ありがとう大きな説明のために!私はいくつかのテストを行いましたが、それは現場にあるようです。 –

+0

それが助けてくれたことを知ってうれしい! – Maniteja