0
Outwitハブを使ってairwars.orgにこのページをスクラップしています。RegExの1行で異なる日付フォーマットを掻き集める
私はすべての日付をこすりしたいと思いますが、それらは異なるフォーマットしている:
- 2017年9月4日
- 9月5日 - 6日2017
- 9月6日 - 7日2017
- 9月8日/ 9th 2017
最初のものはSeptember \d+[a-z]+ 2017
ですが、それらをすべてRegExの1行でどのようにターゲティングしますか?
を私が決定的にこれを言うことはできませんが、私はあなたには、いくつかの文字列を行う必要があると思いますこれを解決するためにプログラミング言語で解析します。たとえば、8/9日は2つの異なる日です。私はこれを別の日付のインスタンスに分割する必要があると思います。 – ThisClark