2017-09-27 5 views
0

例:トレーニングでは、ユーザーがすべてのフィールド(約40フィールド)をフォームに入力し、期待される出力を使用します。テスト機能/属性が不明な場合に、どの機械学習アルゴリズムがシナリオに最も適していますか?

ここでモデルを構築します(人工ニューラルネットやSVMやロジスティック回帰など)。

最後に、ユーザーはフォームに3つのフィールドを入力し、予測が必要になります。

このシナリオでは、私が使用できる最良のMLアルゴリズムは何ですか?

+0

私は3つのフィールドを取ることは常に同じではありませんか?可能性は[ベイジアンネットワーク](https://en.wikipedia.org/wiki/Bayesian_network)です。 – jdehesa

+0

ツリーベースのモデルは欠損値を処理できます。だから、彼らは試してみる価値があるかもしれない。 – Stergios

+0

私の友人は同じことを示唆 - ツリーベースのモデルを使用します。私はそれを試し、最高のものが何かを見てみましょう。ありがとう@ステルギオス。私はベイジアンネットワークもチェックアウトしますが、単純なアルゴリズムで十分でしょう。 –

答えて

-1

私はそれがあなたの問題の特定の状況によって異なると思う。どんな種類の入力に基づいて予測しようとしていますか?

例えば、は、Netflixのような企業によって、非常に疎な特徴ベクトル(カタログ内のすべての映画のうちの小さい割合のユーザーの既存の評価)に基づいて映画のユーザーの評価を予測する。

もう1つの方法は、疎な特徴空間から、SVMやニューラルネットワークなどの分類を実行する共通の潜在空間へのマッピングアルゴリズムを開発することです。私はthis paperが何か似ていると信じています。 this oneのような論文を見て、2つの異なるドメイン(トレーニングとテストの両方の設定が類似しているが、完全なデータと完全ではないデータを含む)からのデータを共通のものに変換する分類器を探すこともできます分類のための潜在空間。ドメインに依存しない分類には実際に多くのことがあります。

検索するキーワード(始めるためにいくつかのリンクがあります):generative adversarial networks (GAN)domain-adversarial training、ドメインに依存しない分類、転送学習。

関連する問題