tidyverse

    2

    2答えて

    時系列データをグループごとに設定する方法を探していました。私が使用していた非常に非効率的な方法は、グループごとにデータセットをsplitに設定し、そのリストのすべての要素でカスタム時系列フィル関数を適用します(最大と最小の間のシーケンスを作成してマージします)。言うまでもなく、この操作は分割を通過しません。 私のデータセットが source grp cnt 1: 83 2017-06-

    0

    1答えて

    データフレームに、草食系寄生虫resultの月間データmonthに、レベル "Hymenoptera"または "Diptera"の寄生虫の順序 'psitorder' resultは、草食動物の草食動物の場合は「p」、草食動物が大人になった場合は「a」、草食動物が捕らわれてデータが存在しません。 df<-data.frame(month= c(rep(1, each=8), rep(2, each

    1

    4答えて

    を追加し、私はこのようなtibble持っていると言う:私は(unnestで例えば)リストをネスト解除することによって、より大きな新しいtibbleに変換したい tibble(x=22:23, y=list(4:6,4:7)) # A tibble: 2 × 2 x y <int> <list> 1 22 <int [3]> 2 23 <int [4]> を、ど

    0

    1答えて

    これはおそらく愚かな質問ですが、私はグーグルとグーグルで解決策を見つけることができません。私はそれが私の質問を検索するための正しい言い方を知らないからだと思う。 私はストップワードを取り除くために、私が整理したテキストフォーマットに変換したデータフレームを持っています。私は今、そのデータフレームを元のフォーマットに戻したいと思っています。 unnest_tokensの反対/逆のコマンドは何ですか?

    0

    1答えて

    私はRをAnacondaとJupyterで使用しています。また、私はtidyverseライブラリを使用しています。 私が実行します。 days_label <- factor(df$days) fct_recode(days_label, 'Mon;Tue;Wed;Thu;Fri;' = 1, 'Sat;' = 2, 'Sun;' = 3)

    1

    1答えて

    複数のcsvファイルのディレクトリを読み込もうとしていますが、それぞれ約7K +行と約1800列です。私は、データ・ディクショナリを持っていて、データ・フレームに読み込むことができます。ここで、データ・ディクショナリの各行は、変数(列)名とデータ型を識別します。 readrパッケージ内にある?read_csvを見ると、列の種類を指定することができます。しかし、私は約1800の列を指定しているので、

    1

    1答えて

    最近、Rの共通データフレーム操作からtidyverseに移動しました。しかし、私はscale()機能でカラムのスケーリングに関して問題があります。 私のデータは、いくつかが数値であり、いくつかのカテゴリ的な特徴からなる列で構成されています。また、最後の列はデータのy値です。ですから、最後の列ではなくすべての数値列を拡大したいと思います。 select()関数を使用すると、非常に短い行のコードを記述

    1

    2答えて

    これについての回答を見つけるのは本当に難しく、重複している場合は謝っています。 私は質問を説明するためにいくつかのダミーデータを作成します。彼らが1に等しい場合、彼らはの値を取るように私は条件付きで列SAMPLE1とSAMPLE2の値を変更する方法に tibble(a=c(0.1, 0.2, 0.3), sample1 = c(0, 1, 1), sample2 = c(1, 1, 0)) #

    -1

    2答えて

    私は、purrr :: mapでcsvファイルのリストを取得し、大きなリストを取得しました。 csv_files <- list.files(path = data_path, pattern = '\\.csv$', full.names = TRUE) all_csv <- purrr::map(csv_files, readr::read_csv2) names(all_