2009-03-10 4 views
0

OK、長いリスト(約43,800行)のエントリがあり、このリストのサブセットを選択したいと思います。リストはデータベース内にあり、データベースを読み取るプログラムは1つ以上の正規表現を使用できます。長いリスト、複数の正規表現とパフォーマンス

は、使用する方が良いでしょう、基本的に私は

OR

をしたい項目を選択するために、(おそらく100かそこらまで)データベースプログラムへの1回の呼び出しで正規表現を複数を使用することをお勧めします(約10まで)正規表現の非常に少ない数の配列に、より多くの項目を選択し、文は私は興味がないデータをフィルタリングする場合はループといくつかの簡単に使用するには?

正規表現が計算コストが高いため、過剰使用を避けることをお勧めしますか?

答えて

2

私はあなたが別のスレッドに正規表現検索をforkする方法を見つけて行くいくつかの並行性を得ることができる場合は特に、第二のアプローチをお勧めします。分裂して征服する、赤ちゃん!

2

KevDogの答えは正しい方法のようです。

私はちょうどあなたが両方を試してみて、パフォーマンスの差を測定する場合がありますことを追加したいです。そうすれば、推測のすべてを排除し、われわれがおそらく知ることのできない特別なケースを自然に考慮に入れます。