2017-06-17 9 views
0

私は約200.000行dfと20列を持ち、1列にはステーションの名前が含まれています。これは次のようになります。Pythonのパンダでの列値の解析

00001 OPPT YY G 
00002 LIMO DA G 
000016 KAPAL VS G 
0000663 TAPS VS G 
... 

数値を列の値から取る最良の方法は何ですか。 所望の出力:

00001 
00001 
000016 
0000663 

おかげ

答えて

1

Col1と仮定すると、あなたの列空間上

df 
Out: 
       Col1 
0 00001 OPPT YY G 
1 00002 LIMO DA G 
2 000016 KAPAL VS G 
3 0000663 TAPS VS G 

分割され、最初の要素取る:

df['Col1'].str.split().str[0] 
Out: 
0  00001 
1  00002 
2  000016 
3 0000663 
Name: Col1, dtype: object 
+0

まあ、時にはそれが異なるため、最初の単語は、数字、私の悪いことができます。 – jovicbg

+0

@jovicbg私はそれが正規表現を必要とし、私はそれをよくしていないと思う。答えを受け入れることができないので、人々はこれを解決したとみなして質問を見ません。ところで、質問を編集する方が良いかもしれません。 – ayhan

0

ので、この機能を使用することができます。例えばのために、あなたのデータフレームは、DFであり、あなたの最初の列は、このデータが含まれている場合:

(df.T).ix[0] 

私はこの意志を願っています助けます。