私はあなたがstr.split
が必要だと思う。そして、
data = pd.read_csv('data/training.csv')
data.iloc[:,-1] = data.iloc[:,-1].str.split(expand=False)
str[1]
またはstr[n]
でリストの最初のまたはいくつかの他の要素を選択します。
data.iloc[:,-1] = data.iloc[:,-1].str.split(expand=False).str[0]
data.iloc[:,-1] = data.iloc[:,-1].str.split(expand=False).str[n]
サンプル:
import pandas as pd
data = pd.DataFrame({'A':[1,2,3],
'B':[4,5,6],
'C':[7,8,9],
'D':[1,3,5],
'E':[5,3,6],
'F':['aa aa','ss uu','ee tt']})
print (data)
A B C D E F
0 1 4 7 1 5 aa aa
1 2 5 8 3 3 ss uu
2 3 6 9 5 6 ee tt
print (data.iloc[:,-1].str.split(expand=False))
0 [aa, aa]
1 [ss, uu]
2 [ee, tt]
Name: F, dtype: object
data.iloc[:,-1] = data.iloc[:,-1].str.split(expand=False).str[0]
print (data)
A B C D E F
0 1 4 7 1 5 aa
1 2 5 8 3 3 ss
2 3 6 9 5 6 ee
data.iloc[:,-1] = data.iloc[:,-1].str.split(expand=False).str[1]
print (data)
A B C D E F
0 1 4 7 1 5 aa
1 2 5 8 3 3 uu
2 3 6 9 5 6 tt
Can anyone explain why I am getting the above error and how can I get around it?
問題imageString.split(" ")
リターンlist
とdata[idx,-1]
に割り当てた場合、文字列の構成要素の長さは、全てのデータフレームの長さ以下です。
Is this the proper way to apply a split to every value in the last column of my data frame?
pandas documentationを参照してください。
データ[data.columns [-1] = data.ilocの[:、 - 1]の.map(ラムダX:x.split ( '')) – frist