2017-08-10 14 views
0

不正な書式設定をしているメールアドレスがあり、そのドメインに大文字と小文字が混在しているため、これらのリソースを訂正できるようにする必要があります。これは壊れたデータを修正する特別なケースです。私は大文字と小文字の混在したドメインですべてのリソースを取り戻す必要があります。solrクエリを大文字と小文字の混在した文字列に変換する

私はこのクエリについての最初の手がかりがなく、それが可能であるかどうかもわかりません。

答えて

1

大文字と小文字を一致させようとする正規表現を使用してクエリを実行できます。これは、アドレスが格納されている正確にどのように依存します(それは各トークンにうまくいくので、チェーンのLowercaseFilterFactoryがある場合、私はそれが任意のヒットを見つけることができません推測している):あり

# retrieve all those that have a lowercase letter followed by a uppercase letter 
q=email:/.*[a-z][A-Z].*/ 

# retrieve all those that have a uppercase letter followed by a lowercase letter 
q=email:/.*[A-Z][a-z].*/ 

これらの2つのクエリーの間に重複がありますので、同じ作業を2回実行することを避けるために順番に処理してください。

+0

ahhh私はあなたがq-フィルタで正規表現を使用できるかどうか分かりませんでした。 – Remi

関連する問題