コード現在使用して最初の列を除外し、それを読むために何をすべきかを
パンダのデータフレームにテキストファイルを読みながら、:
dframe_main =pd.read_table('/Users/ankit/Desktop/input.txt',sep =',')
コード現在使用して最初の列を除外し、それを読むために何をすべきかを
パンダのデータフレームにテキストファイルを読みながら、:
dframe_main =pd.read_table('/Users/ankit/Desktop/input.txt',sep =',')
うあなたがそれを読んだ後でただ列を削除するだけで十分ですか?これは機能的には、最初の列を読み込みから除外することと同じです。ここでおもちゃの例です:
import numpy as np
import pandas as pd
data = np.array([[1,2,3,4,5], [2,2,2,2,2], [3,3,3,3,3], [4,4,3,4,4], [7,2,3,4,5]])
columns = ["one", "two", "three", "four", "five"]
dframe_main = pd.DataFrame(data=data, columns=columns)
print "All columns:"
print dframe_main
del dframe_main[dframe_main.columns[0]] # get rid of the first column
print "All columns except the first:"
print dframe_main
出力は次のとおりです。
All columns:
one two three four five
0 1 2 3 4 5
1 2 2 2 2 2
2 3 3 3 3 3
3 4 4 3 4 4
4 5 2 3 4 5
All columns except the first:
two three four five
0 2 3 4 5
1 2 2 2 2
2 3 3 3 3
3 4 3 4 4
4 2 3 4 5
私はusecolsパラメータを使用することをお勧めします:
usecols:配列のような、デフォルトなしのサブセットを返しません列。
の結果、解析時間が大幅に短縮され、メモリ使用量が大幅に削減されます。
:In [32]: list(range(5))[1:] Out[32]: [1, 2, 3, 4] dframe_main = pd.read_table('/Users/ankit/Desktop/input.txt', usecols=list(range(5))[1:])
あなたのファイルが5列を持っていると仮定すると、