例として提示されています。パンダの2つのデータセットのアライメントを見つける方法
2つのデータセット。 1つは1時間にわたって収集されたものです。その時間内に20分以上にわたって収集されたもの。
各データセットには、イベントが発生しているかどうかを表すtrue(-
)またはfalse(_
)の単一の列に変換できるイベントのインスタンスが含まれています。
DS1.event:
_-__-_--___----_-__--_-__---__
DS2.event:
__--_-__--
私は2つのデータの相関関係(専門用語が間違っているなら、私を修正)を自動化する方法を探していますDS2が最も多い(上のxが多い)DS1へのオフセットを設定し、見つける。これはおそらくマッチの正当性を判断するためのしきい値と一致するパーセンテージで終了します。
よう
_-__-_--___----_-__--_-__---__
__--_-__--
DS1.start + 34min〜= DS2.start
追加情報:
DS1は、おおよそ1 Hzで記録しました。約30HzのDS2。これにより、100%クリーンマッチが起こる可能性は低くなります。
他の方法(パンダへの)は高く評価されますが、python/pandasは自分の使い捨てのものです。
numpy.convolveを使用して、その最大値? – Evert