私はGATE(JavaベースのNLPフレームワーク)を使用しており、辞書と部分的に一致する単語を探したいと思っています。 たとえば、私は次の用語辞書の部分一致
Congestive cardiac failure
Congestive Heart Failure
Colon Cancer
.
.
.
Thousands of more terms
のは、それが辞書での用語の一部として発生するので、私は、この文字列から文字列"Father had cardiac failure last year"
として、私は部分一致として「心不全」を識別したいしていると仮定しましょうと病気の辞書を持っています。
私はPython、JS、C#で同様の問題について議論してきましたが、ここでは何が助けになるのか分かりません。 ここでAho-Corrasickを利用できるのだろうかと思います。
@eowlからの主なアイデアを使用して、同様のコンポーネントを開発ちょっとおかげで、私はただの提案に努めますが、として今は私の質問をそこに掲載することはできません。正しいのですか? – Sap
@eow私はSOと同じログインを使用していたので、同じ名前が表示されますが、同じスコアは表示されません。 – Sap