2
パンダのデータフレームに複数の行に行を爆発:私は次のヘッダーを持つデータフレーム持って
id, type1, ..., type10, location1, ..., location10
をし、次のように私はそれを変換したい:
id, type, location
は、私が使用してこれを行うために管理ループのために埋め込まれていますが、非常に遅いです:
new_format_columns = ['ID', 'type', 'location']
new_format_dataframe = pd.DataFrame(columns=new_format_columns)
print(data.head())
new_index = 0
for index, row in data.iterrows():
ID = row["ID"]
for i in range(1,11):
if row["type"+str(i)] == np.nan:
continue
else:
new_row = pd.Series([ID, row["type"+str(i)], row["location"+str(i)]])
new_format_dataframe.loc[new_index] = new_row.values
new_index += 1
ネイティブなパンダの機能を使って改善するための提案はありますか?
あなたのデータセットの量はどれくらいですか? – MMF
@MMF数GB for now – MedAli