2つの列$ startと$ endに基づいて効率的に何度も行を検索する必要がある大きなRデータフレームがあります。私は典型的な解決策は、O(N)であることを想像:DataFrame列の効率的な値の参照
data[data$start <= start & data$end >= end, 1]
私は列の少なくとも一つをソートし、より効率的なO(ログ(N))のルックアップを行うことを好むだろう。ルックアップのためにデータフレーム内で順序付けを利用するには、どのような組み込みのRメソッドがありますか?
あなたは 'data.table'パッケージを試すことができます – James
これは実際には遅いですか?あなたはどれくらいのデータを持っていますか? – hadley
インデックスルックアップとサブセット化は一般的にコードボトルネックではないほど速いので、再現可能なタイミングの例を提供すると便利です。 –