1
文字列から可変数の単語からなる部分文字列を抽出するためにpyparsingを取得しようとしています。pyparsingを使用して可変長部分文字列を抽出する
次はほとんど動作しますが、サブ文字列の最後の言葉を失う:
text = "Joe F Bloggs is the author of this book."
author = OneOrMore(Word(alphas) + ~Literal("is the"))
print author.parseString(text)
出力:
['Joe', 'F']
私は何をしないのですか?
PS:私はこれを正規表現で行うことができますが、具体的にはpyparsingを使って書かれた大きな努力に適合する必要があるため、特にpyparsingでそれをしたいと思っています。