私はRegexに苦労しています。私はwikiを読んで遊んでいましたが、私は正しいマッチをするようです。Pythonは内側の括弧を外して、外側の括弧を残します
string_before = 'President [Trump] first name is [Donald], so his full name is [[Donald] [Trump]]'
string_after = 'President [Trump] first name is [Donald], so his full name is [Donald Trump]'
外側の角かっこと内側のテキストを保持しながら、内側の角かっこを削除したいと考えています。
これは正規表現なしでPythonで簡単に解決できますか?
正規表現はネスト処理にはあまり適していません。 – khelwood
これらの括弧で始まるテキストは、どこから入手していますか? – Blender
私は名前付きエンティティタグ付けを行っています。名前には[]が付いています。だから、この場合、タガーは、ドナルドがエンティティであり、トランプがエンティティであり、ドナルドトランプが別のエンティティであるため、3つの異なるエンティティを持つと考えています。これは特別なケースです。「Donald」がテキストの冒頭に、「Trump」が真ん中に、そして新しい組み合わせ「Donald Trump」が最後に記載されている場合があります。 – Isbister