2012-03-26 12 views
1

テキストブロック内の句テンプレートを簡単に検出する方法はありますか?テキスト与え例えば句テンプレートの検出

、:

これにアプローチする方法がわかりません。それは非常に難しく、難しいことは私がそれをする方法を知らないということです。しかし、それは誰かにとっては明らかでしょうか?

テンプレート:

[X]、および[X]私は[Y]

が試合につながる意味によります。

私はそのようなことが正規表現で可能かどうかわかりませんが、いくつかの説明の正規表現が最良の賭けとなると思います。

ボーナス:多くのテンプレートを連続してマッチングしようとすると、計算効率が最も高いアプローチは何ですか?

編集:明確にするために、私は完全一致が必要です。

リンゴ、リンゴで私はあなたが正規表現によってマッチングが必要な場合は、このいずれかを使用することができます梨

答えて

1

を意味しています:たとえば上記のテンプレートはないには、次のものが一致しなければならない

(\w+), and by \1 I mean \w+ 

apple, and by apple I mean pineapple -> match 
apple, and by apple I do mean pear -> not match 

(\w+) - matches 1 word and save it to first group 
\1 - word from first group 
\w+ - match second word 

http://regexpal.com/

により正規表現と遊ぶしかし、あなたは本当にマッチングが必要な場合あなたが必要とするすべてのパターンを定義し、独自のパターンを定義する必要があります。finite state machine

+0

リンクありがとう! –

関連する問題