オープンな名前付きエンティティ認識の問題(生物学/化学、エンティティの辞書は存在しませんが、コンテキストによって識別する必要があります)に適応するための最良のモデルは何ですか?TensorFlow名前付きエンティティ認識のRNN
現在、私の推測ではSyntaxnetをN、V、ADJなどのようにタグ付けするのではなく、BEGINNING、INSIDE、OUT(IOB表記)としてタグ付けするようにしています。
しかし、私はこれらのアプローチのどれがベストであるかわかりません。
- Syntaxnet
- word2vec
- seq2seq(seq2seqは、翻訳のように異なる長さのシーケンスのために設計されているのに対し、私は、私は2つの整列された配列に学ぶためにそれを必要として、これは正しいものではないと思います)
正しいメソッドへのポインタに感謝します!ありがとう!
Syntaxnetとseq2seqが動作します。また、contribには線形連鎖CRFがあります。 – drpng