-2

のために機能以下の情報組み合わせる単語ベクトルとスカラーは、分類

人の

入力 年齢(1-100)人の 性別(男性または女性)文章をモデル化するために、文

出力 ラベル(コンテンツの種類)

の 内容私はtfidfと組み合わせたword2vecを使用しています。また、分類器に埋め込まれた文章とともに、年齢と性別を特徴として追加したいと思います。これを行う正しい方法は何ですか?埋め込みはn次元の配列と年齢なので、性別はスカラーです。私はそれらを追加し、データを視覚化する方法について混乱しています。

答えて

0

ワード埋め込みは、n次元ベクトルとして、n個のスカラに過ぎません。

たとえば、単語ベクトルから派生した300次元のベクトルがある場合、年齢スカラー(1-100)、次にジェンダースカラー(おそらく0または1)、分類子のデータの次元は302です。

このようなさまざまな機能を連結する例については、sklearn FeatureUnion transformerを参照してください。 (そのような多様な特徴がより似通った範囲/分布を持つようにスケールされていると、より良い性能を発揮する分類器もあります)

関連する問題