私はWikipediaのすべてのWikipedia記事タイトルを含むWikipedia記事タイトルファイルをダウンロードしました。可能性のある記事のタイトルをすべて検索する必要があります。たとえば、私は "ホッケー"という言葉を持っているかもしれませんが、私が欲しいホッケーに関するWikipediaの記事は "Ice_hockey"です。大文字と小文字を区別しない検索にする必要があります。大きな文字列ファイル(Python)で部分文字列一致を見つける最も効率的な方法
私はPythonを使用していますが、行単位で検索するよりも効率的な方法がありますか?理想的には、毎分500回または1000回のような検索を実行します。行ごとに私の唯一のオプションがある場合、私はこれでできるいくつかの最適化はありますか?
私はファイルに数百万行があると思います。
アイデア?
ありがとうございました。
予想される入力を示してください。ファイルはどの形式ですか?自分でファイルをダウンロードするのを手伝ってくれる人を作ってはいけません。 – aaronasterling
それは、各タイトルがそれ自身の行にある単純なテキストファイルです – apexdodge