2017-06-14 7 views
0

私はScikit LearnのMulti Layer Perceptron Classifierをこの目的のために使用する予定です。
出力は男性の場合は[1,0,0]、女性の場合は[0、1、0]、女性の場合は[0、0、1]のようにワンホットエンコーディングで表現される単語のジェンダーです。 入力の1つが単語の単語ベクトルです。これらのベクトルのそれぞれは、20の次元を有する。 その他の機能は、Part Of Speech TagsとSingularity(0)/ Plurality(1)の状態です。 私の質問は、どのようにMLPClassifierの機能として配列であるword vectorを使うのですか?word2vecから返された単語ベクトルをフィーチャとして使用するにはどうすればよいですか?

+0

女性用に2つのクラスがありますか? –

答えて

1

あなたのw2vベクターは、単語に関していくつかの意味的類似性を捕捉します。このベクターは全体として考慮する必要があります - それはそれ自身の特徴です。

ニューラルネットワークの優れた特性の1つは、独自のパターンを抽出して学習する能力です。入力として、あなたはPOSタグのベクトル化/数値同等と一緒に単語ベクトルを連結検討することもでき、そして最終的に特異点状態:限り、あなたはトレーニング、テストと一致スキームに従うよう

------------------- ---- - 
\_________________/ \__/ |  } ------ 25d vector input to the MLP (assuming your POS takes 4 spaces) 
    w2v vector  POS state 

、およびあなたのMLPは入力全体を使って入力から自動的に特徴を抽出します。

+0

もう一度おねがいします!ところで、GloVeパッケージはヒンディー語をサポートしていませんでした! – Djokester

+0

@Djokesterああ!それを聞いて申し訳ありません。 :(うまくいけばw2vはあなたによって良いことをする。幸運! –

関連する問題