私は単純な「ハック」を探して、次のアイデアを実装しています:特定の単語を人工的にすべての単語のコンテキストで表示したい監督された文章分類にはword2vecを使用します)。Word2vec:すべてのコンテキストに外部単語を追加します。
例がベストです:だから我々は(ターゲット、コンテキスト)の次PAISになるだろう"The dog is in the garden"
、および1
の窓:
は私が文を持っていると言う
しかし、私はword2vecアルゴに送りたいことはこれです:
(dog, The), (dog, is), **(dog, W)**, (is, dog), (is, in), **(is, W)**, etc.,
私の単語Wがすべての単語の文脈にあったかのように。
ここで、Wは自分の選択した単語であり、既存の語彙ではありません。
Rまたはpythonでこれを行う簡単な方法はありますか?
「Context Enrichment」と似たようなものがありますか? http://aclweb.org/anthology/R/R15/R15-1029.pdf – Mehdi
ありがとうございます。ありがとうございました!基本的に私のアイデアは、彼らの「豊かな文脈」の特別なケースであるようです。 私は実際に自分の袖を巻いて自分でコード化しなければならないのだろうか... –