私は約200.000行dfと20列を持ち、1列にはステーションの名前が含まれています。これは次のようになります。Pythonのパンダでの列値の解析
00001 OPPT YY G
00002 LIMO DA G
000016 KAPAL VS G
0000663 TAPS VS G
...
数値を列の値から取る最良の方法は何ですか。 所望の出力:
00001
00001
000016
0000663
おかげ
私は約200.000行dfと20列を持ち、1列にはステーションの名前が含まれています。これは次のようになります。Pythonのパンダでの列値の解析
00001 OPPT YY G
00002 LIMO DA G
000016 KAPAL VS G
0000663 TAPS VS G
...
数値を列の値から取る最良の方法は何ですか。 所望の出力:
00001
00001
000016
0000663
おかげ
Col1
と仮定すると、あなたの列空間上
df
Out:
Col1
0 00001 OPPT YY G
1 00002 LIMO DA G
2 000016 KAPAL VS G
3 0000663 TAPS VS G
分割され、最初の要素取る:
df['Col1'].str.split().str[0]
Out:
0 00001
1 00002
2 000016
3 0000663
Name: Col1, dtype: object
ので、この機能を使用することができます。例えばのために、あなたのデータフレームは、DFであり、あなたの最初の列は、このデータが含まれている場合:
(df.T).ix[0]
私はこの意志を願っています助けます。
まあ、時にはそれが異なるため、最初の単語は、数字、私の悪いことができます。 – jovicbg
@jovicbg私はそれが正規表現を必要とし、私はそれをよくしていないと思う。答えを受け入れることができないので、人々はこれを解決したとみなして質問を見ません。ところで、質問を編集する方が良いかもしれません。 – ayhan