生の発生データからネットワークグラフデータを生成しようとしています。生データでは、さまざまな状況で機能の発生率があります。異なる映画の俳優だとしましょう。各行は[コンテキスト、機能、重み]です。ここで、重みは画面時間の量です。ここではおもちゃのデータセットです:ファクタベクトルと合計値のペアワイズの組み合わせを計算する
df <- data.frame(context = sample(LETTERS[1:10], 500, replace=TRUE),
feature = sample(LETTERS, 500, replace=TRUE),
weight = sample(1:100, 500, replace=TRUE)
)
ムービーAのためにそう、私たちは、各行は俳優の名前と、その映画の中で自分の画面の時間である20行を持っているかもしれません。
私が生成したいのは、それぞれのムービーのすべてのアクターのペアごとの組み合わせで、それぞれのウェイトの合計です。だから、例えば、我々が開始した場合:
[A, A, 5]
[A, B, 2]
私は[コンテキスト、特長1、特徴2、sum.weight]の形式で出力したいと思います。だから、:
[A, A, B, 7]
私は、forループの組み合わせでこれを介して実行する方法を知っているが、私は特に、データのようなもので、これに近づくより「古典R」方法があるかどうかを知りたいのです。表。ここで
感謝!このような徹底的な答えを提供する時間を取っていただき、本当にありがとうございます。これは、私が他の人々がこれにどのようにアプローチするかを見るのに役立ちます。 – Runic