data.table

    5

    2答えて

    私はturn == 3のN番目の発生時に、-1に「DIS」を変更したいdata.table library(data.table) car <- data.table(no = 1:100, turn = sample(1:5,100,replace = TRUE), dis = sample(1:10,100,replace = TRUE)) があり、「ターン」という第三の

    1

    2答えて

    私はdataというデータフレームを持っています。私はCRD_NUMとBIZ_DTごとに0と1で新しい列を作成しようとしています。最大Jrny_Indを確認し、その行に最大値がある新しい列に1を割り当てます。 は、ここで作業するためのデータです: structure(list(JRNY_ID_NUM = c(115485143065, 115581455926, 115542253339,

    0

    1答えて

    2つの整数列の合計がクラスnumeric、タイプdoubleであることを防止する理由と方法を理解できません。何か案が? は、ここでは、代わりintegerとして新しい列を返すように+演算子と組み合わせてReduce()を使用することができ、小さな作業例rowSums()として library(data.table) set.seed(123) A <- rnorm(20, 100, 5)

    2

    2答えて

    私は、Rの中でdata.tableやdplyrのような共通のパッケージを使用する関数を書く方法を学んでいます。 私が書いたこの関数は、他のグループ(例えば、20〜15年にリリースされた10〜20mpgの車のシェア)内の特定のカテゴリの観測のパーセンテージを計算してテーブルを生成します。 library(data.table) library(scales) #Create test dat

    1

    1答えて

    つの列の値を変更する私は、次のようなdata.tableがあります ID Date v3 v4 1 2015.01.01 a 5 1 2015.02.01 b 5 1 2015.03.01 f 1 1 2015.04.01 z 5 1 2015.05.01 a 2 2 2013.03.01 a 6 2 2013.04.01 a

    2

    1答えて

    ここでの目的は、csvテーブルを読み取ることです。ファイルには直接URLがあります。 fread(data.tableパッケージ)を使用したいのはread.csvで高速ですが、少し問題があります。 options(scipen=999) caracteristiques=read.csv(url("https://www.data.gouv.fr/s/resources/base-de-don

    0

    3答えて

    私はこのような(以下を参照)ような(指示された)二項データセットを持っています。私が今やりたいことは、1年に1回だけ観察することです。この場合、1992年(AFG 1992年)と1993年(AFG 1993年)の観測はそれぞれ1回のみだったが、他の観測は削除された。同じ年のどの観測結果がデータに保存されているかは問題ではありません(country2には興味がありません)。 country1 cou

    2

    1答えて

    私は既存のものから要約data.tableを作成しようとしていますが、私は列プレフィックスを渡すことができるようにするためにこのようにしたいと思います。必須。 私は質問/応答hereを見たことがありますが、:=オペレータを使用していないときの対応方法を考えています。 Reprex:これは、作成中の列名用の固定名を使用している library(data.table) tbl1 <- data.ta

    3

    1答えて

    私は慣れ親しんでいないデータの準備と管理をたくさん行っている新しいプロジェクトに取り組んできました。 1)数千の観測値と変数(df1)を持つ非常に大きな2つのデータフレームと、2)df1(df2)の変数のサブセットの収集年の範囲をリストするデータフレーム。 df1の変数/列の大きなサブセットに対して、df1に新しい変数を作成する必要があります。 df1用に作成された新しい変数は、値が存在するか(1