kaggleからのATPデータセットがあります。私はRでそれに取り組んでいます。データセットでは、試合日、都市、トーナメント名、勝者名、敗者名、試合勝者の合計セット、試合敗者の合計セット、勝者の合計ゲーム、敗者が勝ったトータルゲームなど。因子の値を、因子で何回起こったかの回数を格納する新しい変数に変換します。
私の注目は、勝者と一致する敗者の列です。 これらの列は、プレーヤー名の値を持つ因子変数です。
私が望むのは、x軸がプレーヤーの名前を表し、y軸がプレーヤーの名前を表している場合、異なるプレーヤー(勝ち抜き率が最も高いトップ5またはトップ10プレーヤー)のマッチ・ウィン・ロス率のグラフをプロットすることです。軸はそのプレーヤーの勝敗率を表します。
このグラフを作成するにはどうすればよいですか。私はdplyrパッケージのパイプライニングを次のように使ってみました: WinnerとLoserは階乗変数です。
roger_wins <- atp %>% filter(Winner == "Federer R.") %>% count(Winner)
roger_loss <- atp %>% filter(Loser == "Federer R.") %>% count(Loser)
しかし、この方法では、各プレーヤーごとにハードコードする必要があります。私はトップ5またはトップ10プレーヤーのために、この使用してコードを実行するためにどのように これは、データ・セットを見つけることができるページですR. でソリューションを提供してください(損失を勝つために応じて):場合 https://www.kaggle.com/jordangoblet/atp-tour-20002016
他のサイトに人を送り込んでデータをダウンロードするのではなく、dput()を使用してデータの小さなサンプルを貼り付けてください。 – eipi10