私は、列内の位置(これはSNP /ゲノミクスの仕事です)を表す値を持つデータセットを持っています。欠損データによって表される範囲を計算する - R
私は欠けているデータの各伸びの距離を計算する方法を見つけようとしています(以下「ギャップ」といいます)。例えば。 1466-1650 = 184
また、連続観測の伸びを計算することもできますが、最初の問題を把握すると比較的簡単になると思います。例えば。 1450-1466 = 16
は、ここでデータが編成されている方法の例です:
1450
1466
NA
NA
1650
1654
1943
NA
2568
ネクタイ私の次の問題は、データセット内のすべてのサンプルを分析しようとするとこの質問 - 各サンプルをループ - see my question here
ありがとう!私は連続して別の列を作成しようとしています:rl2 < - rle(!is.na(df $ data))#rleは値がNAではないかどうかについて - しかし、私はcumsumを働かせることはできません。 ? – krepsen
これを必要とする人には、PS単体の観測値はNAと報告されているので、それを見てください: cont < - df $ data [cumsum(r2 $ lengths)[r2 $値]] - #upper_bound df $ data [cumsum( r2 $ lengths)[r2 $値] -1] #lower_bound – krepsen