データセットがあり、名前付きエンティティ認識用にタグを付ける必要があります。私のデータセットはペルシア語です。 次のような表現をどのようにタグ付けする必要があるかを知りたいとします。タグ付けとトレーニングNERデータセット
***آقایمهدیکاظمی= Mr Mehdi Kazemi/Mr will Smith。 >>>(タイトルの付いた名前)私はすべてを人物としてタグ付けするか、最初の名前と姓だけにタグを付ける必要がありますか? (私も "Mr"とタグを付けるべきです)
Mr >> b_per ||氏>> O
Mehdi >> i_per || Mehdi >> b_per
Kazemi >> i_per || Kazemi >> i_per
***鼻水病院>> Noor hospital >>>名前のついた病院や名前と病院の両方に名前付きエンティティとしてタグを付ける必要がありますか?
***エッフェル塔/それが呼び出されたペルシャ語で防衛省(Iは、例えば、私たちDODを意味する)>>>: وزارتدفاع(vezarateのDEFA) は、私が唯一の防衛にタグを付ける必要がありますか?またはすべて一緒に?
名前付きエンティティの前にエンティティクラスを使用しているので、学校、映画、都市、国などにはもっと多くの例があります。
このデータセットにタグを付けるのを手伝っていただければ幸いです。
私はそれを得たと思います。ありがとうございました。 – Hedieh