私は、いくつかの日付の値を持つ文字列を持っており、それらをすべて解析したいと思います。文字列は自然言語なので、私が今までに見つけた最良のものはdateutilです。長い文字列からすべての日付を解析する方法についてPython(または他の言語)のテキストブロックから複数の日付を解析する方法
>>> s = "I like peas on 2011-04-23, and I also like them on easter and my birthday, the 29th of July, 1928"
>>> parse(s, fuzzy=True)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/pymodules/python2.7/dateutil/parser.py", line 697, in parse
return DEFAULTPARSER.parse(timestr, **kwargs)
File "/usr/lib/pymodules/python2.7/dateutil/parser.py", line 303, in parse
raise ValueError, "unknown string format"
ValueError: unknown string format
任意の考え:文字列がその中に複数の日付の値を持つ場合
残念ながら、dateutilは、エラーがスローされますか?理想的には、リストが作成されますが、必要に応じてそれを処理できます。
私はPythonを使用していますが、この時点で他の言語はおそらく仕事を終えてもOKです。
PS - 入力ファイルを途中で再帰的に分割して試してみると、うまくいくまで再試行することができますが、ハックの地獄です。
の最大値を収集することですあなたが解析したい日付であることを「イースターに」検討していますか? – MattH
Nah。それが働いているかどうかを調べるためにテストしていましたが、いずれにしてもあまり気にしません。 – mlissner
DateUtil 1.5では、もちろん動作しますが、私の悪いです。しかし、私はまだMattH Shawn Chinよりもクリーナー/スピードの速いアプローチを手に入れたいと思っています。 – Dieter