2015-11-18 18 views
7

私は、マークに基づいていくつかの大学によって選ばれた多くの学生のデータを持っています。 Iamは機械学習に新しい。私はいくつかの提案を持つことができますどのように私は、彼らが自分のマークに基づいて取得することができ大学を予測するためのAzureの機械学習を追加することができます機械学習の提案

答えて

7

多クラスロジスティック回帰を試してみてください - また、ロジスティック回帰は別に、このhttps://gallery.cortanaanalytics.com/Experiment/da44bcd5dc2d4e059ebbaf94527d3d5b?fromlegacydomain=1

+0

あるOneVsRestClassiferにこのMLアルゴリズムを養うロジスティック回帰がFalseクラスの真として出力を与えるようええ、それは行うことができます。これにより、マークのどの値がTrueであるかをチェックすることができます。 –

4

を見て、 @neerajkhが示唆したように、私も同様に試してみます One vs All classifiers。この方法はマルチクラスの問題(学生の印である入力が多いと仮定します)と多くの出力(さまざまな大学)でうまく動作するように使います。

1つのアルゴリズムとすべてのアルゴリズムを実装するには、Support Vector Machines(SVM)を使用します。それは最も強力なアルゴリズムの1つです(深い学習が現れるまでここで深く学習する必要はありません)

フレームワークを変更することができれば、私はPythonライブラリを使用することをお勧めします。 pythonでは、直面している問題を非常に速く計算するのは非常に簡単です。

+1

すばらしい答えだと思います! –

0

マルチクラス分類を使用する他のポスターの提案に沿って、人工ニューラルネットワーク(ANN)/多層パーセプトロンを使用してこれを行うことができます。各出力ノードは大学であり、Sigmoid伝達関数(ロジスティック)を使用するため、各ノードの出力は、その大学が特定の学生を受け入れる確率(予測しようとするとき)として直接見ることができます。

0

softmax回帰を試してみませんか?

非常に簡単な言葉で言えば、Softmaxは入力を受け取り、それぞれのクラスに属する入力の確率分布を生成します。つまり、いくつかの入力(この場合はグレード)に基づいて、あなたのモデルは、与えられたスーセントが各大学に受け入れられるべき「チャンス」を表す確率分布を出力することができます。

0

私はこれが古いスレッドだと知っていますが、私は先に進んで2セントも追加します。

マルチクラス、マルチラベル分類子を追加することをおすすめします。これにより、学生のために複数の大学を見つけることができます。もちろんこれはANNではるかに簡単ですが、設定するのがはるかに難しくなります(ネットワークの設定、ノード/隠れノードの数、またはその機能についての活性化機能など)。

これを@Hoap Humanoidとして行う最も簡単な方法は、サポートベクター分類器を使用することです。

これらの方法のいずれかを実行するには、多様なデータセットが必要です。私はあなたが実験しなければならないデータポイントの数を言うことはできませんが、モデルの精度はデータポイントの数とその多様性に依存します。

0

これは非常に主観的です。カテゴリに分類するアルゴリズムを適用するだけでは良い考えではありません。探索的データ解析を実行すると、以下のことをチェックしないで、あなたは離れて欠損値から、やって予測分析の確認することはできません。

  1. 量的および質的変数。
  2. 単変量、二変量および多変量分布。
  3. 応答(大学)変数との可変関係。
  4. 異常値を検索する(多変量および単変量)。
  5. 必要な変数変換。
  6. 候補者がカリフォルニアやニューヨークの大学の一部であるかどうかなど、Y変数をチャンク(例:場所)に分解することができます。カリフォルニアの可能性が高い場合は、どの大学に進学するのですか?このようにして、線形+非線形関係を捕捉することができます。

ベース学習者のためにあなたが本当に非直線的な関係のためにたくさんとCARTの重要されません全てのロジスティック回帰対ソフトマックス回帰モデルまたは1を収めることができます。また、K-nnとK-meansを使って、データ内のさまざまなグループをチェックし、予測学習者を決定します。

これは意味があると思います!

1

使用randomforesttreesとマルチクラス分類