1
わかりやすい質問を - 私は次のことをやっている:データフレームのスピードアップパンダのcsv読み込み、その後の意気消沈
train_set = pd.read_csv('./input/train_1.csv').fillna(0)
for col in train_set.columns[1:]:
train_set[col] = pd.to_numeric(train_set[col],downcast='integer')
最初の列は文字列です - 残りはint型です。 Read_csvは私が必要としない浮動小数点数を与えます。ダウンサンプリングの結果、RAM使用量はほぼ50%削減されますが、処理速度が大幅に低下します。私はすべてのことを1つのステップで行うことはできますか?それとも誰かがこれをマルチスレッド化する方法を知っていますか?
THX
hmm私は考えているが、問題は最初の行が文字列であることです。読み取りプロセスでdtypeを指定しても、文字列では機能しません。あなたは別にそれらを読むでしょうか?注文を保存できますか? – dv3
私はコードを編集しました。コンバーターも私のために働いた – imanzabet
- コードは再び動作しますが、問題は解決しません。これは、名前 '1'の列をintsに変換します。私は最初の列を文字列として、残りの文字列を浮動小数点数(合計551文字)に変換したいと思います。 – dv3