2016-04-13 11 views
1

私はstr.extract()を使用してデータフレームの行にある単語を抽出しようとしていますが、1単語しか取得しません。例えば、私のデータフレームの列のいずれかで:df ['var']を使用して複数の単語を検索するstr.extract()(Python)?

var1 
THIS IS A STRING 

私が使用:

df['words'] = df['var1'].str.extract('([A-Z]\w{0,})') 

出力は、私はこれが全体のフレーズ」を抽出することができますどのように

var1    words 
THIS IS A STRING THIS 

ですSTRING '?

ありがとうございました!

+0

あなたのデータフレームは、 'DF [ 'テスト']' 'からvar1'が、あなたの抽出物を指します。打ち間違え? – Alexander

+0

はい、タイプミスでした。それを指摘してくれてありがとう。 – Jess

答えて

0

IIUCあなたは、任意の空白\s+、その後applySeriessplitを使用することができます。

print df 
       var1 
0 THIS IS A STRING 

print df.var1.str.split('\s+').apply(pd.Series) 
     0 1 2  3 
0 THIS IS A STRING 
+0

どのように動作しますか? – jezrael

関連する問題