2017-05-21 16 views
0

私は、テキストデータ内で値が見つかる特定の正規表現を持っています。例えば、[a-zA-Z]{10}のような10文字です。問題は、この値が角かっこ、引用符、またはスペースの内側にあるだけで、結果として値を抽出する必要があることです。この場合、例えば: - マッチ正規表現内の角括弧、引用符、またはスペース

"abcdefghij" - マッチ

abc abcdefghij abc - マッチ

abcabcdefghijabcを -

<a>abcdefghij</a>

そしてそれぞれのマッチに正規表現を適用した結果を一致しませんこれらの値は内部の値(この場合は abcdefghij)である必要があります。どのようにそれを書くためにどのようなアイデア?

答えて

2

は、あなたはこれを試みることができる:

正規表現:

(?<=\W)[a-zA-Z]{10}(?=\W) 

説明:山括弧、引用符、二重引用符、スペースはすべての非単語文字です。そこで、10個のアルファベットのような非単語の文字を検索するPositive lookbehindとpositive lookaheadを使用できます。

デモ:https://regex101.com/r/mkbOfg/5

+0

ありがとうございました! –

+0

@YuriyYunikovようこそ。これがあなたが探していた正規表現だと思えば、それを答えとして選択してください。 – Gurman

+0

時間のいくつかの期間までそれを受け入れることができませんでした:) –

関連する問題