1
"ORG"列のデータに対して部分文字列を処理しようとしています。私は2番目と3番目の文字が必要です。pandasまたはnumpyを使用して部分文字列を行う方法
Attempt 1: dr2['unit'] = dr2[['ORG']][1:2]
Attempt 2: dr2['unit'] = dr2[['ORG'].str[1:2]
Attempt 3: dr2['unit'] = dr2[['ORG'].str([1:2])
マイデータフレーム:
REGION ORG
90 4 413
91 4 413
92 4 413
93 5 503
94 5 503
95 5 503
96 5 503
97 5 504
98 5 504
99 1 117
100 1 117
101 1 117
102 1 117
103 1 117
104 1 117
105 1 117
106 3 3
107 3 3
108 3 3
109 3 3
予想される出力:任意およびすべてのヘルプのための
REGION ORG UNIT
90 4 413 13
91 4 413 13
92 4 413 13
93 5 503 03
94 5 503 03
95 5 503 03
96 5 503 03
97 5 504 04
98 5 504 04
99 1 117 17
100 1 117 17
101 1 117 17
102 1 117 17
103 1 117 17
104 1 117 17
105 1 117 17
106 3 3 03
107 3 3 03
108 3 3 03
109 3 3 03
おかげで、私は唯一の13を必要とする413ためだから私は、次の試してみました!
それは通常かなり遅いですと '.apply()'メソッドを使用しないようにしてください:
は、新シリーズのアイテムは、パッドに2の幅と
str.zfill
を適用します。 'df.ORG.astype(str).str [-2:]。str.zfill(2)' – MaxU@MaxUこれは良いことです。注目してくれてありがとう。私はパンダでスピードを拾い始めているだけです:) –
ありがとうMoses。 zfillアドバイスは素晴らしいです!私はそれを使用したことはありませんが、間違いなく便利になるでしょう!また、ありがとう、MaxU。私は変換する多くの適用関数を持っています。 – david