2017-10-25 14 views
-2

私はすべてのカテゴリのデータで、固有のラベルを持つデータセットをいくつか持っています。このような 何か:ユニークなラベルによる教師あり学習(分類)

X = 

1,1,1,0,1,0,0,0,1,0 

1,1,0,1,1,0,1,1,1,1 

0,0,1,0,0,0,1,0,0,1 

. 

. 

. 

1,0,0,1,0,0,1,1,0,1 

y = 

AA 

AB 

AC 

. 

. 

. 

ZZ 

私はこの問題は、機械学習以外の何かを解決しなければならないが、私の上司は、機械学習や深い学習アルゴリズムを使用するように私を余儀なくされると信じています。

だから私の質問は次のとおりです。

  1. これを解決するための最良の非機械学習algorihtmでしょうか?

  2. これを解決するための最良の機械学習アルゴリズムは何でしょうか?

+0

あなたの応答変数yでは、すべての値が本当に一意ですか? –

+0

いくつのデータ行がありますか?合計値が(26 * 26)であれば、使用しない。実際のデータがなければ何も言えません。 –

答えて

0

分類上の問題としては意味がありません。任意の分類アルゴリズムによってデータから何かを推測するには、同じラベルを持つ多くの行が必要です。 ラベルを一意の数字に変換することで、この問題を回帰に変えることを提案できます(アルファベットの文字数などを使用)。次に、任意の回帰アルゴリズムを使用して、ラベルなしデータの数を仮定することができます。最後に、これらの数字をテキストラベルに戻すことができます。私はこれがうまくいくかどうかはわかりませんが、試してみることができます。

AA -> 0 
AB -> 1 
... 
AZ -> 25 
BA -> 1 * 26 + 0 = 26 
... 
ZZ -> 26 * 25 + 25 
+0

ありがとうございます。しかし、このようにして、データは順序付けされ、分類されたデータには望ましくありません。 – user3038019

関連する問題