data.table

    2

    1答えて

    私は、多数の列を持つ非常に大きなデータセットを持っています。私はこのデータを集約し、各列のセットごとに異なる機能を実行する必要があります。私は多くの列を持っているので、集計の各列で使用する各関数を手動で指定するのは面倒です。私はdata.tableと集計する方法について多くの記事を読んだことがありますが、この状況を処理するものはありません。 例 はmpgデータセットで作業をします。私はcylとtr

    -2

    1答えて

    data.table Rの2つのLEFTジョインをしようとしています。おそらく私の理解は間違っていますが、左の結合では一致しない行この場合、私は実際にはLEFT JOINから行を失います。どうして? > nrow(aaa) [1] 30070 > ccc <- merge(aaa, bbb, all.X = TRUE) > nrow(ccc) [1] 23358

    1

    1答えて

    値のリストが値の範囲内にあるかどうかを確認してから、特定の値を割り当てる必要があります。私はifelse()ステートメントを入れ子にすることなく、これを行う方法を見つけたい(ちょうどifelseは51回以上ネストすることができず、ひどいと思われる)。 これは実例であるため、これを行うための一般的な方法があるかどうかは疑問です(ループ?*適用など)。私はpaste(eval())と何かを考えています

    0

    2答えて

    データ表の月の名前(Jan、Febなど)のベクトルを数値の等価物(1,2、...)に変換したいと思います。コード which(month.abb == month) は期待通りに動作します。つまり、which(month.abb == "Feb")は2を返します。しかし、データテーブルで使用されているコードと同じコードでは、警告と、予想外の番号を含むtestベクトルが返されます。 dt <-

    0

    1答えて

    列によって定義された値と固定された選択値に応じて、シーケンス列をdata.tableに追加する最適な方法は何ですか。次の例では、入力と希望する出力がilustrates: library(data.table) # Input # Add a column sequence till 7 starting from the value of column V2. dt <- data.ta

    1

    1答えて

    データを3つの異なる期間に分割する必要がありますが、それぞれのデータのギャップ(欠落データ)が最小限になるようにしたい私が最初にPEを定義する場合、この場合 library(lattice) xyplot(Data$Y ~ Data$X,, panel = function(x, y) { panel.xyplot(x, y) panel.abline(v=c

    4

    2答えて

    私は2つのデータセットを持っていますが、私が欲しいのは、「キー以外の変数の外部結合」と呼ばれることがあります。 oc oc2 state_id r_state r_country A011 A01 1808 1.00 0.62 A012 A01 1808 NA 0.14 A013 A01 1808 NA 0.24 A011 A01 1810 0.50 0.62 A012 A01 18