1
spacy libを使用して作成した訓練されたNERモデルを評価しようとしています。 通常、この種の問題には、f1スコア(精度とリコールの比率)を使用できます。私は訓練されたNERモデルの精度関数をドキュメントで見つけることができませんでした。Spacy NERモデルの評価
私はその正しい場合はわからないが、私は以下の方法(例)でそれをやろうとしているとsklearn
からf1_score
を使用しています:
from sklearn.metrics import f1_score
import spacy
from spacy.gold import GoldParse
nlp = spacy.load("en") #load NER model
test_text = "my name is John" # text to test accuracy
doc_to_test = nlp(test_text) # transform the text to spacy doc format
# we create a golden doc where we know the tagged entity for the text to be tested
doc_gold_text= nlp.make_doc(test_text)
entity_offsets_of_gold_text = [(11, 15,"PERSON")]
gold = GoldParse(doc_gold_text, entities=entity_offsets_of_gold_text)
# bring the data in a format acceptable for sklearn f1 function
y_true = ["PERSON" if "PERSON" in x else 'O' for x in gold.ner]
y_predicted = [x.ent_type_ if x.ent_type_ !='' else 'O' for x in doc_to_test]
f1_score(y_true, y_predicted, average='macro')`[1]
> 1.0
任意の考えはあるか洞察が便利です。次のリンクで同じ質問を有するものについては1
1.あなたはgithubのリンクは、この文脈では自己とは何 2.壊れているだ?どこでself.make_goldを見つけることができますか? – farlee2121
@ farlee2121私は次のように答えを更新しました。より明確。 –