私はsklearnでちょっと遊んでいました。DecisionTreeClassifierのfit()は、同じデータを持つ異なるツリーを返します。
私は今、他のいくつかのデータでプレイし始めました。私はこの振る舞いが正しいと私が誤解しているかどうかはわかりませんが、私がfit(x、y)を呼び出すたびに、私は全く異なるツリーデータを取得します。したがって予測を実行すると、60%、次に70%、65%などさまざまな違いが得られます。
2つのツリーを出力するために2回以下のコードを実行しました。彼らはワードで彼ら。ある文書から他の文書の値を検索しようとしましたが、見つけられなかったものがたくさんありました。 私はある種のフィット(x、y)が常に同じ木を返すと考えています。この場合、列車の列車データが私を駄目にしていると仮定します。
clf_dt = tree.DecisionTreeClassifier()
clf_dt.fit(x_train, y_train)
with open("output2.dot", "w") as output_file:
tree.export_graphviz(clf_dt, out_file=output_file)
今後、私はあなたに[再現可能な例](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)があるようにデータを提供したいと思います。人々の手助けが楽になるからです。また、 'python'で質問にタグを付けると、もっと目を覚ますことができます。 – Tchotchke