大規模なデータフレームのサブセットを2つの列、ColAとColB(下記)に基づいて作成したいと考えています。 ColAの各変数(たとえばA、B、C ...)については、ColBの最初の変数の各出現に対応する行を抽出したいと思います。したがって、DF1:列内の最初の変数のすべての部分集合R行
ColA ColB ColC
A Red 7thing
A Red OneBot
A Blue BotOne
B Green Thing7
B Green Twosies
B Green Square
B Yellow Circle
B Yellow Polygon
B Purple Triangle
B White Octagon
C Orange Cube
C Black Line
はDF2になる:
ColA ColB ColC
A Red 7thing
A Red OneBot
B Green Thing7
B Green Twosies
B Green Square
C Orange Cube
私はCOLCで重複を懸念していないですし、COLBにおける変数の出現数にはパターンがありません。私が見つけた関連するサブセッティング戦略は、独自のケースを抽出することに重点を置いていましたが、最初の変数タイプのすべての選択を許可する方法を考案せず、何らかの援助に感謝します。
I(例えばSubset first n occurrences of certain value in dataframe in R)
DF2 <- DF1[match(unique(DF1$ColB), DF1$ColB),]
を試み...可変コンテンツが既知である場合、変数を標的サブセットが、これらは一見適切ではありません。
あなたはどのようなコードを試してみました?にしている使用してアプローチSOはコーディングサービスではないコーディングリソースです – Nate
私はポストを編集していくつかのコードを追加しましたが、役立つ場合はそれ以上を置くことができますが、それ以外の適切なコードのバグではありません。私の質問がサービスを期待しているように見えた場合にはお詫びします。そうでない場合、私のガイドとして使用されているすべての質問に対して、コードを含むSOガイドラインが示唆していたようです。 – SPZ