多数の文字列(各ペアの間)でテキストマッチングを行い、重複したサブシーケンスを見つける必要があります。私はknuth morris prattアルゴリズムがこの仕事に最も適しているかどうかを知りたい私はPythonでこの機能が欲しいですし、文字列の大規模なセットに対してスケーラビリティが必要ですか?私はこれが最善の方法であるかのようなアドバイスを探していますか、スケーラブルで効率的な文字列マッチングを行うための良い方法がありますか?Pythonでの高速テキストマッチング
-1
A
答えて
0
TL;スケーラブル+効率= RegEx。
私はあなたが読むことをお勧めしますまず第一に:Regular Expression Matching Can Be Simple And Fast。
RegExは、マッチングのためだけでなく、グループキャプチャとバックリファレンスの可能性も提供するため、おそらく最もスケーラブルなソリューションです。
さらに、Pythonのre
モジュールはC言語で書かれており、おそらくPythonで書かれているほとんどのコードより高速です。
Knuth-Morris-Prattアルゴリズムを使って簡単に部分文字列を検索する場合、現実世界の単語やフレーズ(これほど反復的ではありません)では、RegExが平均的に優れています。
関連する問題
- 1. 高速Python MySQL
- 2. 高速のUart(Python)
- 3. Pythonの高速サブセットサブリスト
- 4. 高速python HTMLパーサ
- 5. 高速Python IPv6コンパクション
- 6. Pythonの高速素数篩
- 7. Pythonイテレータの高速化
- 8. Pythonの高速pingスイープ
- 9. プロセスの高速化Python
- 10. 分散/高速のPythonユニットテスト
- 11. Numpy/Pythonでのパフォーマンスの高速処理
- 12. WindowsでのPythonアクセスの高速化
- 13. pythonとopencvでの高速コンポーネントラベリング
- 14. Pythonでの高速バイナリデータ変換
- 15. pythonロード・インスタンスが高速
- 16. Python高速単色ビットマップ
- 17. Python - 高速ファイル検索
- 18. python/numpyでデルタフィルタを高速化する
- 19. Pythonのパレートフロントの高速計算
- 20. 高速なPythonフロントリストの拡張
- 21. Pythonコード時間の高速化
- 22. Python 3の高速for forループ
- 23. Python Curses:プログラムの高速終了
- 24. Python:高速サブセッティングとループのデータフレーム
- 25. 高速/高速RCNの座標系
- 26. 高速レポートは、高速レポートVのハイパーリンク
- 27. Selenium for Python - 部分テキストマッチングのためのtext_to_be_present
- 28. pythonとsqlalchemy関数を高速化
- 29. Pythonコードを高速化する
- 30. Python/Cythonループを高速化します。
正規表現操作の「re」モジュールでは、「re.match()」および「re.search()」メソッドが役に立ちます。とにかく、正確に必要なものをもっと明確にしてください。 – Ardit