ツールを探しています(理想的には)か、多数のテキストファイル。私の場合、「単語」は実際にはファイル名ですが、スペースは含まれません。テキストを見つけるために必要なツールやAPIには、大規模な辞書からの単語が含まれています。
高速アルゴリズムでは、辞書を読み込んでDFA(確定的有限オートマトン)を構築し、任意の数のファイルで辞書単語のインスタンスを見つけるためにシングルパスを使用することができます。
注:私はこのSO質問のように正確なテキストマッチングないファジーマッチングを希望しています: - Algorithm wanted: Find all words of a dictionary that are similar to words in a free text
言語に対応したAPI ?? – run