私はPython-pandasを初めて使いました。現在、DataFrameのデータが連続しているかどうかをチェックするために使っています。例:範囲()関数のように、...パンダのDataFrameに欠けている行を伝える最も良い方法は何ですか?
thread sequence start end
14 1 114 1647143 1672244
15 1 115 1672244 1689707
16 1 116 1689707 1713090
17 1 118 1735352 1760283
18 1 119 1760283 1788062
19 1 120 1788062 1789885
20 1 121 1789885 1790728
すべての行は4列を所有しているが、一般的な順序で1のステップで増加しなければならないので、すべてが正しければ、それは116117118のようになります。しかしここでは、シーケンス== 117の行が抜けています。
私はそれを見つけようとしましたが、どうやってそれを行うのか分かりません。シーケンスを1つずつチェックするだけでは、効率が悪くなります。目的の出力は、欠けている行を伝えるか、欠落している行をNaNで埋めることです。
良いヒントやご提案があれば助かります。
多くの感謝!ちょうど私が必要なもの。 – Castor
@Castorデータフレームではなく値だけが必要な場合は、受け入れられた回答を使用しないでください。それは非常に遅いです。 –
@COLDSPEEDはい、私はあなたが「最も速い方法」と言ったことに気付きました.DataFrameを取得してからNaNを見つけるのがはるかに遅いようですが、後でそれをテストするベンチマークを行います。先端ありがとう。 – Castor