2017-05-16 7 views
0

したがって、dd.mm.yyyyと表示されているいくつかの日付を抽出しようとしています。Python/Jythonを使用してOpenRefineで複数の結果を返しますRegEx

細胞のいくつかは、一つだけの日付が含まれている、そのうちのいくつかは、私は気にしないより多くの文章とともに、(DD.MM.YYYYへDD.MM.YYYYからのような)複数の日付が含まれています。

「From」と「To」の2つの列を作成するには、両方の日付を抽出する必要があります.1つの日付で発生したイベントの空白は残ります。

私はPython/Jythonで次の式を使用しようとしましたが、複数のセルを含むセルの最初の日付のみを返します。

import re 
g = re.search("([0-9])([0-9])\.([0-9])([0-9])\.([0-9])([0-9])([0-9])([0-9])", value) 
return g.group() 

どのようにして両方の日付を返すことができますか?

ありがとうございます!

答えて

0

.findall()を使用してすべての一致を得ることができます。また、各桁のためのキャプチャグループを削除し、代わりに[0-9]

import re 
g = re.findall("\d{2}\.\d{2}\.\d{4}", value) 
return g 
+0

感謝の\dを使用して、あなたの正規表現は少しシンプルに!プレビューでは機能しましたが、セルを変換しようとしたり、それに基づいて新しい列を追加しようとすると、データセットに何も返されません –

+0

リストのどのメンバーを自分のセルに配置するかを指定する必要があります。出来た!もう一度ありがとうございます:) –

関連する問題