tidyr

    0

    1答えて

    私はfull_joinを実行したい4つのデータセットを持っています。簡潔にするため、ここではdf1とdf2という2つのデータセットを使用します。 df1 <- data.frame(ID = c(1, 3, 4, 5), V1 = LETTERS[11:14], V2 = letters[17:20]) df2 <- data.frame(ID = c(1, 10, 4, 9, 13), X5

    0

    1答えて

    はtydyテキスト上のこの本、次のnグラムを得 library(tidyr) bigrams_separated <- austen_bigrams %>% separate(bigram, c("word1", "word2"), sep = " ") bigrams_filtered <- bigrams_separated %>% filter(!word1 %i

    1

    1答えて

    tidyrをRから使用しています。重複した識別子でspread()コマンドを使用しているときに問題が発生しています。ここで は、問題を示しモック例です。私は、このコマンドを実行すると X = data.frame(name=c("Eric","Bob","Mark","Bob","Bob","Mark","Eric","Bob","Mark"), metric=c("height"

    0

    3答えて

    卵巣カテゴリーに個体(名前)が複数回現れるデータがあります。個人ごとに1つのサンプルしか存在しないようにしたいと思いますが、Rが最初に見つけたものを保持したいとは思いません。私はグループが他のすべてのカテゴリで最も出現しているものを保持したいと思います。うまくいけば私の例はこれを明確にするのに役立ちます。 library(tidyverse) myDF <- read.table(text="T

    1

    1答えて

    ダミーの例を使用して、暗黙の欠損値を持つデータセットを完成させる必要があります。これはtidyrの機能completeを使用してRで自明です。 library(tidyr) df <- data.frame(Borough = c('Brooklyn', 'Brooklyn', 'Queens'), Crime = c('Robbery', 'Homicide', 'Drug'

    3

    2答えて

    文字列には、行ごとに異なる値の文字列があります。これは、ほんの少しの例である:私は、列名と後の値として、コロンの前に値を割り当てる structure(list(GoodForMeal = "dessert': False, 'latenight': False, 'lunch': True, 'dinner': True, 'breakfast': False, 'brunch': False}

    -1

    1答えて

    整然としたデータフレームがあり、行ごとに用語とトピックが1つあります。これはかなり直感的なようだが、私はそれを行う方法を見つけ出すことはできません topic1, topic2 blue, dog green, cat 人間読みやすくするために、 num_topic, term 1, blue 1, green 2, dog 2, cat 私は別の列に各トピックを手配したいと思

    0

    1答えて

    行を識別する一意の識別子がない選択されたいくつかの列を使用してデータセットを広げたいと思います。このために、私は公開されている虹彩データセットを使用しています。 私は最初に不要な列を削除してから、重複のない一意の値を作成してみました。その後、その上にスプレッドを適用します。 iris %>% select(-c(Sepal.Width, Petal.Length, Petal.Width)) %>

    1

    1答えて

    目的:各セルに複数の値が含まれている(多くの場合))列を持つデータフレームをクリーンアップします。 v1のセルに含まれる値に基づいて、複数のバイナリ変数(v1_1、v1_2、v1_3など)を生成したいと考えています。 (現実:私は、複数の値を持つ多くのセルを持つ非常に大規模で醜いExcelデータセットを持っており、バイナリカラムに理想的には並べてツールを並べ替えるのが理想です。 再現例:dplyr

    -1

    1答えて

    編集---私は範囲を小さくするために質問を整理しました。 データフレームを次の形式で集計しようとしていますが、問題が発生しています。 これは、電話システムからのisdnログ出力であるため、ログ全体に同時に発生するコールが含まれています。これらの呼び出しは、発信するのではなく、着信する性質のものです。 データフレームは、以下のようになります。 "V1" "V2""V3""V4" "V5" "V6"