データセットはチャンクによって読み込まれます。 idsは最初の列で、配列のようなデータ構造に格納したいと考えています。これまでのところ、それは動作していません。このように見えますPython Pandas:チャンクからデータのIDを取得します。
tf = pd.read_csv('data.csv', chunksize=chunksize)
for chunk in tf:
here I wanna store the ids chunk["Id"] in an array
どうすればよいですか?あなたはそれをこのように行うことができます
なぜあなたはちょうどそのコラムを読んでいない:
をあなたはnumpyの配列として
ids
シリーズに常にアクセスすることができますか?例えば'tf = pd.read_csv( 'data.csv'、usecols = ['Id'])'? – EdChum