data.table

5熱

2答えて

私はturn == 3のN番目の発生時に、-1に「DIS」を変更したいdata.table library(data.table) car <- data.table(no = 1:100, turn = sample(1:5,100,replace = TRUE), dis = sample(1:10,100,replace = TRUE)) があり、「ターン」という第三の

1熱

2答えて

data.tableを使用して条件に基づいてバイナリ列を作成します。

私はdataというデータフレームを持っています。私はCRD_NUMとBIZ_DTごとに0と1で新しい列を作成しようとしています。最大Jrny_Indを確認し、その行に最大値がある新しい列に1を割り当てます。は、ここで作業するためのデータです： structure(list(JRNY_ID_NUM = c(115485143065, 115581455926, 115542253339,

0熱

1答えて

整数列の合計が2倍です

2つの整数列の合計がクラスnumeric、タイプdoubleであることを防止する理由と方法を理解できません。何か案が？は、ここでは、代わりintegerとして新しい列を返すように+演算子と組み合わせてReduce()を使用することができ、小さな作業例rowSums()として library(data.table) set.seed(123) A <- rnorm(20, 100, 5)

2熱

2答えて

R：ユーザー定義関数内のgetとdata.tableの使用

私は、Rの中でdata.tableやdplyrのような共通のパッケージを使用する関数を書く方法を学んでいます。私が書いたこの関数は、他のグループ（例えば、20〜15年にリリースされた10〜20mpgの車のシェア）内の特定のカテゴリの観測のパーセンテージを計算してテーブルを生成します。 library(data.table) library(scales) #Create test dat

1熱

1答えて

重複data.table内の各グループの最後の行と

つの列の値を変更する私は、次のようなdata.tableがあります ID Date v3 v4 1 2015.01.01 a 5 1 2015.02.01 b 5 1 2015.03.01 f 1 1 2015.04.01 z 5 1 2015.05.01 a 2 2 2013.03.01 a 6 2 2013.04.01 a

2熱

1答えて

大きな数字を読むときfread（Rのdata.table）を使用する際のバグはありますか？

ここでの目的は、csvテーブルを読み取ることです。ファイルには直接URLがあります。 fread（data.tableパッケージ）を使用したいのはread.csvで高速ですが、少し問題があります。 options(scipen=999) caracteristiques=read.csv(url("https://www.data.gouv.fr/s/resources/base-de-don

0熱

3答えて

データ変換：ダイアディックから観測データへR

私はこのような（以下を参照）ような（指示された）二項データセットを持っています。私が今やりたいことは、1年に1回だけ観察することです。この場合、1992年（AFG 1992年）と1993年（AFG 1993年）の観測はそれぞれ1回のみだったが、他の観測は削除された。同じ年のどの観測結果がデータに保存されているかは問題ではありません（country2には興味がありません）。 country1 cou

2熱

1答えて

data.table変数名を使用したグループ化

私は既存のものから要約data.tableを作成しようとしていますが、私は列プレフィックスを渡すことができるようにするためにこのようにしたいと思います。必須。私は質問/応答hereを見たことがありますが、:=オペレータを使用していないときの対応方法を考えています。 Reprex：これは、作成中の列名用の固定名を使用している library(data.table) tbl1 <- data.ta

3熱

1答えて

lapply - 2番目のデータフレームの情報に基づいて条件付きで現在の変数に基づいて新しい変数を作成します。

私は慣れ親しんでいないデータの準備と管理をたくさん行っている新しいプロジェクトに取り組んできました。 1）数千の観測値と変数（df1）を持つ非常に大きな2つのデータフレームと、2）df1（df2）の変数のサブセットの収集年の範囲をリストするデータフレーム。 df1の変数/列の大きなサブセットに対して、df1に新しい変数を作成する必要があります。 df1用に作成された新しい変数は、値が存在するか（1