複数の区切り文字+/,.;
を使用して次の値を分割したいとします。他の記号は区切り記号として使用しないでください。例えば複数の区切り文字に基づいて分割に制約を追加するにはどうすればよいですか?
、
CAP.44,45+62(400)
e.morgan,44+32/78
私は、次のコードを書いた:問題は.
が例外を持っているかもしれないということです
import re
data['COUNT'] = data['STRING_VALS'].apply(lambda x: len(re.findall(r'[+/,.; ]+', x)))
を。次のマスク_.___
の場合は区切り文字として使用しないでください。したがって、.
の前に1文字があり、.
の後に任意の数の文字がある場合は、_.___
を分割しないでください。
このようなマスクベースの制約を上記のコードに追加するにはどうすればよいですか?
'a.b.c'についてはどうですか?いくつの部品を分割する必要がありますか? –
@AlexHall:3つの部分に分割する必要があります。 – JoeBlack
それは私が期待したものではありません。だから、あなたは前にドット以外の文字が1つと複数ある場合にだけドットを分割したくないのですか? 'a.bb.c.dd'を' a.bb'と 'c.dd'に分割する必要がありますか? –