セグメンテーション: - 2の倍数に「終了」行方向データフレームには、次のデータフレームを考える
df = pd.DataFrame(data={'item': [1, 2, 3, 4], 'start':[0.0, 2.0, 8.0, 6.0],
'end': [2.0, 6.0, 8.0, 14.0]})
どのように私はすぐに間隔「スタート」をセグメント化することにより、上記データフレームの行単位を拡大していますか?
上記の例では、結果のデータフレームは、私がチェックするために何百万行を持っているよう
Out=
item start end
1 0.0 2.0
2 2.0 4.0
2 4.0 6.0
3 8.0 8.0
4 6.0 8.0
4 8.0 10.0
4 10.0 12.0
4 12.0 14.0
パフォーマンスは、私にとって最も重要であるべきです。 セグメント化を必要としない行に対してブールインデックスを使用してデータフレーム全体をすでにフィルタリングしていました。それはすばらしいスピードアップです。しかし、残りの行では、「forループ」を適用し、追加した正しい長さのデータフレームを作成しました。残念ながら、パフォーマンスは何百万行も十分ではありません。
専門家のソリューションを楽しみにしています!
ありがとうございます。私はこれまで同様のことをしていました。私ははるかに速いと信じている代替ソリューションを投稿しました。 –