私は大きなデータフレームを持っています(合計で8,500,000セルを少し超えています)、特定の列の値に基づいてこのデータフレームのいくつかのサブセットを作成する必要があります。マスタデータフレームの列の各値に対してデータフレームのサブセットを作成することは可能ですか?
私は上記のサブセットを手作業で作成することができますが、いくつかの値しかない場合はこれを行うことができます。現時点では、私は一意の値取得:
table(df$ColumnX)
をしてからわずか数値があるとして、そこから個々のデータフレームを構築:
df.subset1 <- df[df$ColumnX == "Subset1", ]
df.subset2 <- df[df$ColumnX == "Subset2", ]
...
df.subsetX <- df[df$ColumnX == "SubsetX", ]
は、しかし、かなり多くの一意の値がある場合にどこにあります私の目標を適時に達成するためにコンピュータの処理能力が必要となる問題を見てください。
私が知りたいことは、このプロセスを自動化できるかどうかです。このような
何かが私は達成するために期待していますものです:
- List values in Column X
- Create a new dataframe/subset for each value in Column X
または:
for(all unique values in Column X)
create a new dataframe
end for
したがって、私はColumnX
の値に基づいて、このような何かを持っているでしょう:
df.subset1
df.subset2
...
df.subsetX
ただ、 'split'すなわち' dflist <使用 - スプリット(DF、DF $ COLUMNXを) '。これはあなたにデータのリストを与えるでしょう。フレーム –
私は参照してください。そして、リストからdata.framesをどのように抽出するのですか? – MusTheDataGuy
'x < - split(iris、Specis $ Species)'の例を見ると、 'x $ setosa'や' x [[1]] 'や' x [["setosa "]]' –