私はre.split()
を使って文字列をトークンに分割しています。現在、引数として使用しているパターンは[^\dA-Za-z]
で、文字列から英数字のトークンを取得します。Pythonで数字/文字トークンを区切ります
しかし、私が必要とするのは、数値と文字の両方をトークンに分割することです。
re.split(pattern, "my t0kens")
は、["my", "t", "0", "kens"]
を返します。
私はlookahead/lookbehindを使う必要があるかもしれないと思っていますが、それが実際に必要か、それとももっと良い方法があるか分かりません。
はあなたの2つの提案の組み合わせに絞ることができ、コードの1行にしなければなりません: '印刷re.findall( '[a-zA-Z]の+ | \\ D +'「、私の"['my'、 't'、 '0'、 'kens']' –
@Bart - これははるかに優れています! – kjp
バートの編集では、これは私の答えよりもはるかに優れています。 +1 –