Python Pandas：チャンクからデータのIDを取得します。

データセットはチャンクによって読み込まれます。 idsは最初の列で、配列のようなデータ構造に格納したいと考えています。これまでのところ、それは動作していません。このように見えますPython Pandas：チャンクからデータのIDを取得します。

tf = pd.read_csv('data.csv', chunksize=chunksize) 
for chunk in tf: 
    here I wanna store the ids chunk["Id"] in an array

どうすればよいですか？あなたはそれをこのように行うことができます

2016-09-23 tumbler

なぜあなたはちょうどそのコラムを読んでいない：

ids = pd.DataFrame() tf = pd.read_csv('data.csv', chunksize=chunksize) for chunk in tf: ids = pd.concat([ids, chunk['Id']], ignore_index=True)

をあなたはnumpyの配列としてidsシリーズに常にアクセスすることができますか？例えば'tf = pd.read_csv（ 'data.csv'、usecols = ['Id']）'？ – EdChum

IIUC：

ids.values

2016-09-23 21:32:05 MaxU

しかし、残りの行も必要です。だから私はusecolsを使用しません。 – tumbler

しかし、現在の問題には関係ありません。私はちょうどあなた自身のようにあなたの前の答えを修正しました。 – tumbler

カラム名をIdとしてどのように設定できますか？ – tumbler

答えて