Pythonは内側の括弧を外して、外側の括弧を残します

私はRegexに苦労しています。私はwikiを読んで遊んでいましたが、私は正しいマッチをするようです。Pythonは内側の括弧を外して、外側の括弧を残します

string_before = 'President [Trump] first name is [Donald], so his full name is [[Donald] [Trump]]' 
string_after = 'President [Trump] first name is [Donald], so his full name is [Donald Trump]'

外側の角かっこと内側のテキストを保持しながら、内側の角かっこを削除したいと考えています。

これは正規表現なしでPythonで簡単に解決できますか？

出典

2017-02-17 Isbister

正規表現はネスト処理にはあまり適していません。 – khelwood

これらの括弧で始まるテキストは、どこから入手していますか？ – Blender

私は名前付きエンティティタグ付けを行っています。名前には[]が付いています。だから、この場合、タガーは、ドナルドがエンティティであり、トランプがエンティティであり、ドナルドトランプが別のエンティティであるため、3つの異なるエンティティを持つと考えています。これは特別なケースです。「Donald」がテキストの冒頭に、「Trump」が真ん中に、そして新しい組み合わせ「Donald Trump」が最後に記載されている場合があります。 – Isbister

括弧のペア内部隣接する二つの括弧式の具体的なケースでは、これは便利隣接括弧式の任意の数まで拡張しませんが、おそらくそれはあなたのニーズに十分だ

string = re.sub(r'\[\[([^][]+)\] \[([^][]+)\]\]', r'[\1 \2]', string)

を行うことができます。

出典

2017-02-17 10:12:22 tripleee

正規表現を使用すると、このような問題よりも害が大きくなります。文法やルールに基づいた構文解析ロジックを書く必要があります。

たとえば、入れ子構造の解析に適した有限状態変換器（1、2）を見ることができますが、Regexより理解して使用するほうが複雑です。

出典

2017-02-17 09:32:30

In [1]: import re 
In [2]: before='blablabla [[Donald] [Trump]] blablabla' 
In [3]: l=before.find('[')+1 
In [4]: r=before.rfind(']') 
In [5]: before[:l] + re.sub(r'[][]','',before[l:r]) + before[r:] 
Out[5]: 'blablabla [Donald Trump] blablabla'

エラーチェック/処理は省略されています。

出典

2017-02-17 10:02:22 Kent

クール、ええ、それはその特定の場合を解決します。私は十分に私の例を黙示しませんでした。「ドナルド」は大統領のファーストネームだと思うが[ドナルド] [トランプ]と呼ばれる人もいる[ドナルド] [トランプ]「私」私の質問が更新されます。 – Isbister

Pythonは内側の括弧を外して、外側の括弧を残します

答えて

関連する問題