0
私は一連のイメージとタイムスタンプデータを含む大きなバイナリファイル(〜4 GB)を持っています。私は、ユーザーが指定したタイムスタンプに最も近いイメージを見つけたいと思っています。しかし、ファイルには何百万ものタイムスタンプがあります。 Python 2.7では、seek、read、struct.unpackを使用して、すべてのタイムスタンプを配列に読み込むのに900秒以上かかりました。すべての値を読み取る必要のない最も近い値を見つけるための効率的なアルゴリズムはありますか?それらは単調に増加するが、非常に不規則な間隔で増加する。バイナリファイルの最も近い値を見つける
"バイナリファイル"と言うと、ファイル内のデータの構造は何ですか?それはある時点でピクルスされたPythonのリストですか? – inspectorG4dget
いいえ、それは各フレームの終わりにタイムスタンプが挿入された画像データ用の16ビット整数のストリームです。タイムスタンプは、年の初めから4バイト、その後は2バイト、その後10MHzのクロックティックでは3バイトです。 –