SpacyV1では、文書とBILOU形式のエンティティ注釈のリストを提供することでNERモデルを訓練することができました。Spacy 2.0 NER Training
V2トレーニングでは、このようなエンティティアノテーション(7,13、 'LOC')を提供することによってのみ可能であるように見えます。エンティティオフセットとエンティティタグを使用します。
トークンのリストを提供する古い方法とBILOU形式のエンティティタグの別のリストは有効ですか?
ドキュメントから収集したところから、nlp.updateメソッドがGoldParseオブジェクトのリストを受け入れるので、各ドキュメントのGoldParseオブジェクトを作成し、BILOUタグをエンティティ属性に渡すことができました。しかし、GoldParseクラスの他の属性(例えば、頭やタグhttps://spacy.io/api/goldparse)を無視して重要な情報を失うか、NERを訓練するために必要とされない他の属性ですか?
ありがとうございます!
既にできました!私はBILOUタグ(U、O、I、B、L)でラベルを追加していました。 – melalonso