2016-10-11 13 views
1

離散値とテキストの文字列からなる入力データがあり、出力はタグのセットであると仮定します。分類のためのテキストデータの扱い

これをニューラルネットに入力できるデータに変換するには、テキスト入力の処理方法を理解することができません。

テキスト入力のみを使用して、思考ベクトルを生成するRNNが動作すると仮定しますが、入力データの残りの部分をどのようにフィードするのかは少しは不明です。

答えて

1

RNNを使用してテキスト入力を処理する場合、RNNの出力を個別の機能のワンホットエンコーディングと連結することができます。次いで、連結されたベクトルを出力層に供給することができる(例えば、マルチラベルにわたるクロスエントロピー損失を計算するロジスティック)。

同様に、埋め込みレイヤーを使用して入力テキストをマッピングしている場合、個別のフィーチャの別の埋め込みも学習できます。 2つの埋め込みフィーチャファミリを連結して、出力レイヤに供給することができます。

enter image description here

+0

少し無関係なフォローアップの質問:あなたは年齢の4次元の埋め込みに手の込んだだろうか? – angerman

+0

私は離散的な特徴の例を作った。たとえば、18以下、19〜35,36〜45,46以上の有効な値があるとします。カーディナリティは低いので、埋め込みディメンションを低くしました。 – greeness

+0

これをクリアしていただきありがとうございます!とても有難い。私は年齢を正規化しようとし、1つの次元のみを使用しました。しかし、この埋め込みは私にとって興味深いと思います! – angerman

関連する問題