1
Python beginner here。私はパンダに正規表現を使うのに苦労している。私はこのような行を、数字だけを含む列に分割する必要があります。regex for pandas dataframeを使用してキャプチャグループを1つだけ抽出する方法はありますか?
rando45m text78 here 123 $ 1 0% text here 5 . 6&
私はそれが私は、次の2つの方法
df2 = df.Keep.str.extractall('(\d+)((\s+)|(\%))')
df3 = df.Keep.str.extractall(r'(?<=\s)(\d+)(?=\s+|\%)')
DF2は、セル内の空白を含むを使用している
0 1 2 3
0 123 1 0 5
として表示される必要があります。アサーションエラーに対してdf3エラーが発生しました。 データフレームに1つのグループ/ 1しかキャプチャできない方法はありますか?
おかげ
なぜだけではなく、 'R '(\ D +)''? –
または 'r '(?<!\ S)(\ d +)(?= [\ s%] | $)' ' –
入力文字列を編集しました。テキストには数字も含まれています。 df3 'と同じエラーが返されます。' 1つの列が渡され、渡されたデータに6つの列があります。 '(' <= \ s)(\ d + – Ppoc