2017-11-20 4 views
0

以下は、私のデータセットにある3つの列です。 だから私はおそらく予測地域は、国と品種の列に基づいて。 私はこの方の完全に新しいですし、誰かが私を提案したり適用する上で私を導くことができれば幸いです、モデルのどのモデルを適用することができますか、モデルを適用するのは混乱します

col1(country) col2(variety)    col3(region) 
Argentina  Chasselas     r1 
Israel   Gamay      r2 
Mexico   Grenache     r3 
Chile   Kalecik Karasi    r4 
China   Kallmet      r5 

誰かが私にこの

以上の他のアイデアを与える場合、私はDecisionTreeClassifierとして知られている何かをしようとしていますが、幸せになります
+1

回帰分析は、分類作業に使用する必要があるとはほとんど思いません。ここをクリックしてください:http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html –

+0

@cᴏʟᴅsᴘᴇᴇᴅ、私のモデルを訓練するのにここでどの列を使用しますか?あなたの終わりからの少しの簡単な答えは私を喜ばせるのに役立ちます –

+0

私は知らない、r1とr2は何ですか?クラスや数字? –

答えて

0

おそらく、私はこれに名目上の従属変数を扱うので、可能なツールとして複数ロジスティック回帰を考えています。

基本的に、(単純な)線形回帰は、連続値を予測するアルゴリズムです。ロジスティック回帰は、ラベル(0または1)に属する入力の「確率」を出力するバイナリクラシファイアアルゴリズムと見なされます。

使用多重ロジスティック回帰あなたは1 名目変数 と二つ以上の測定変数を持っている、とあなたは 測定変数は、名目変数にどのような影響を与えるかを知りたいとき。従属名目変数の確率を予測するのに を使用することができます。また、 の場合は、従属変数に大きな影響を与える変数 についての提案に使用できます。 Ref Handbook of Biological Statistics

+0

は多項回帰として知られていますか? –

+0

ロジスティック回帰は、公称値または順序値に適用できます。あなたは名目の後です。 – wp78de

+0

私はこれをPythonで学び実装してくれてありがとう。私はあなたが私に転送することができますPythonとのリンクを見つける場合にも私はそれを探しています –

関連する問題