以下は、私のデータセットにある3つの列です。 だから私はおそらく予測地域は、国と品種の列に基づいて。 私はこの方の完全に新しいですし、誰かが私を提案したり適用する上で私を導くことができれば幸いです、モデルのどのモデルを適用することができますか、モデルを適用するのは混乱します
col1(country) col2(variety) col3(region)
Argentina Chasselas r1
Israel Gamay r2
Mexico Grenache r3
Chile Kalecik Karasi r4
China Kallmet r5
誰かが私にこの
以上の他のアイデアを与える場合、私はDecisionTreeClassifierとして知られている何かをしようとしていますが、幸せになります
回帰分析は、分類作業に使用する必要があるとはほとんど思いません。ここをクリックしてください:http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html –
@cᴏʟᴅsᴘᴇᴇᴅ、私のモデルを訓練するのにここでどの列を使用しますか?あなたの終わりからの少しの簡単な答えは私を喜ばせるのに役立ちます –
私は知らない、r1とr2は何ですか?クラスや数字? –