2016-07-28 14 views
-3

私はRegexでグループ化して作業しようとしていますが、いくつかの情報を取得するのに問題があります。私は何を達成したいことは、次のテキストを持つ、次のとおりです。私は、たとえばので、アカウントにオッズ<ed>正規表現のグループ化の選択

を取って、文字のグループを選択し、正規表現式をしたい

<ed><a0><bd><ed><b2><9c><ed><a0><bd><ed><b2><9c><ed><a0><bd><ed><b4><91><ed><a0><bd><ed><b4><91> 

を、選択した最初のグループは次のようになります<ed><a0><bd><ed><b2><9c>となり、選択された第2グループは<ed><a0><bd><ed><b2><9c>

となります。どのようにしてこれを達成できますか?

+0

'だろうので、RでTwitterのAPIを介して取得したTwitterのテキストから絵文字を抽出する方法である' - ?正規表現を学びます。あなたの答えは: '(<.*?9c>)' https://regex101.com/r/oD8oR0/1 –

+0

あなたの答えはうまくいかない... –

+0

ラファエルは言ったように、それは動作しません。私は自分で解決策を見つけました。 –

答えて

0

は、最後にそれを行うための方法を発見しました。明確にするためには、コードが、私はこれを達成することができますように

str_extract_all(i, pattern='<U\\+....>|<ed>.*?<ed>.*?>.*?>') 
2

あなたが正規表現のPython実装を使用すると仮定すると、これは動作します:

re.findall('<ed>.*?<ed>.*?(?=<ed>)', string)