2016-03-22 17 views
2

私はimport.ioクローラスクリプトで正規表現を探しています。Regex Lookahead in Import.io(IF-Else-Then)

テキストを含めることができ、次のいずれかのいずれかの場合には

xxx – yyy – zzz 
rrr – sss 

それとも

xxx 
yyy 

は私が YYY一部を必要としています。だから、私は次の先読みスクリプトを作成しました:

(?=.*\–.*)– ([a-zA-Z0-9]*) –|(\n(.*)) 

そして正規表現は101で動作しているようです。 Link to Regex101

しかし、この正規表現をimport.ioで試しても、動作しないようです。だから誰もimport.ioで適切なlookaroundを使う方法を知っていますか?

(追加1: )最初のテストは破線で示されているようです。しかし、第二はしません。まだわからない

+0

あなたは 'yyy'に一致するか、それを見てから、無視する必要がありますマッチ?先読みは後者のために使用されるためです。 –

+0

このregex - ' - \ s *(\ w +)\ s * - | \ n(\ w |)\ n(?:\ n | $)' - ハイフンと空白行の後に続く単語をキャプチャします**または**テキストの終わり。 [regex101](https://regex101.com/r/gK7pN8/1)それはあなたが欲しいものですか? – ClasG

+0

それは誤りの改行であるようです。そのimport.ioはこれを正しく処理しません。しかし、私は第二のグループを得るためにどこにマッチするか分からない。 –

答えて

3

EDIT改行が故障一部である場合、あなたはパターン内の\ sの+と改行を置き換えることができます。

^(?:.*?)(?:\s*–\s*|\s+)(.*?)(?:\s*–\s*|$) 

REGEX 101 DEMO

+0

キャプチャグループは1つの番号で必要です。どちらの場合も、$ 1、$ 2、またはそれが属するグループになります。 –

+0

それからバージョン1を試してください。試合は最初のグループです。 – Quinn

+0

ありがとう、それは働いた! :D –