2017-11-22 5 views
2

私はspaCy v2.0を知り始めました。自分のドキュメントでLightning_Tour.pyを実行すると、行末の文字列\nがエンティティの出力で一貫してGPEとしてタグ付けされていることがわかりました。spaCyでは、なぜ ' n'は英語NERによってGPEとして絶えずタグ付けされていますか?

このタグ付けが行われないようにドキュメントを前処理する方法はありますか?それともデフォルトの英語モデルの動作ですか?

+1

この質問をして以来、spaCy githubサイト[こちら](https://github.com/explosion/spaCy/issues/1717)に問題が公開されています。 – demongolem

答えて

1

はい、私はspaCy 2.0.5を使用していますが、他の人はそれを見ています(上記のコメントを参照)。回避策として、当面生成されたエンティティを後処理する必要があります。

関連する問題