銀行ワイヤ取引のコメントのような自然なテキストからエンティティ(名前、住所、組織)を抽出しようとしています。 NLTK、OpenNLP、およびCoreNLPが使用されていることは明らかです。銀行ワイヤ取引からのエンティティ抽出(非自然テキストなど)
結果を改善する方法はありますか?
テキストは次のように見ることができ、
- EVERITT 620122T NAT ABC INDIA LTD
- REF ROBERT FINEMANN - REASON SHOPレンタル
- REF BY92 00 112233999 - REASONスピード違反の罰金
- GEM SS HEUTIGEM SCHIENDLER
- ペンションCH1234 CAB28
...研究活動や既存製品へ
参考にもあなたが辞書/データベースを使用する必要があります私には思える
あなたはそのようなサービスに「支払う」必要があるかもしれません; P – alvas