多くの文書(100万以上)で多くの単語(1000+)を検索することがよくあります。一致する単語の位置が必要です(一致する場合)。Pythonを使用して多くの文書で多くの式を検索する
コードのので遅い疑似バージョンは
for text in documents:
for word in words:
position = search(word, text)
if position:
print word, position
でこれを行うための任意の高速なPythonモジュールはありますか?それとも自分で何かを実装するべきですか?
1000語の単語に対して何百万語の文書がありますか?なぜあなたのソリューションはそこにある何十ものソリューションよりも優れていると思いますか?何百万もの文書が些細なことではありません。 – Falmarri
@Falmarri:問題のポイントは、Pythonモジュール形式で数十のソリューションの1つを見つけることだと思います。 – nmichaels
基本的にフルテキストインデックスが必要ですか? –