私は、正規表現の最後のグループに 'noun'という単語をマッチさせようとしています。Pythonで単一の正規表現で正規表現グループ内の特定の文字列を検索するにはどうすればよいですか?
は、これまでのところ私が持っている:
noun
UPDATEを:私は取得する必要があり
transportation openair noun
:
tags = 'motocykl mutka 1 motorcycle bike moped 0 transportation openair noun'
print re.search('(?P<pol>\D+)(?P<d1>\d)(?P<eng>\D+)(?P<d2>\d)(?P<end>\D+)', tags).group('end')
私が得るすべては、その最後のグループである文字列です。 :
「名詞」がのように表示されないことを忘れてしまいました。一部の文字列の単語私は正規表現を実行しています。たとえば、次のように
tags = 'dźwig 1 crane 0 noun construction vehicle'
tags = 'trycykl 1 tricycle 0 child noun transportation'
単一の正規表現にしてこれを行う方法上の任意のアイデア?
必要なロジックを推測するのは、あなたの例からは不可能です。トークンが常に「名詞」であれば、「名詞」と文字通り一致するのはなぜですか?そうでない場合、我々はいくつかのトークンが存在し、どのトークンがどれくらいのものかを知ることができないことだけを知っています。 – tripleee
なぜ1つの正規表現が必要ですか?行を解析するために1つの正規表現を行い、最後にマッチしたグループから '名詞'の文字列を取り除くことはできませんか? – steveha