2016-07-11 31 views
-4

私は文字列を持っており、その中にいくつかの情報しか抽出しません。例えばPythonの文字列から情報を抽出しますか?

私はこれを持っている:

'Won 3 Oscars. Another 80 wins & 121 nominations.' 

そして、私はこのようなリストを取得するためには、それを分割したいと思います:

['3 Oscars', '80 wins', '121 nominations'] 

はどのように行うには、私はPythonでやるの?

おかげ

+0

情報を抽出するための制約条件を定義する必要があります。数字の後ろに単語が続く? 2番目と3番目の要素ごとに? – MisterMiyagi

答えて

2

スペース続い単語、その後ワード境界。これは次のようにする必要があります。

import re 

s = 'Won 3 Oscars. Another 80 wins & 121 nominations.' 
p = re.compile(r'\d+\s\w+\b') 

print(p.findall(s)) 
# ['3 Oscars', '80 wins', '121 nominations'] 
関連する問題