2016-10-11 12 views
0

kaggleからのATPデータセットがあります。私はRでそれに取り組んでいます。データセットでは、試合日、都市、トーナメント名、勝者名、敗者名、試合勝者の合計セット、試合敗者の合計セット、勝者の合計ゲーム、敗者が勝ったトータルゲームなど。因子の値を、因子で何回起こったかの回数を格納する新しい変数に変換します。

私の注目は、勝者と一致する敗者の列です。 これらの列は、プレーヤー名の値を持つ因子変数です。

私が望むのは、x軸がプレーヤーの名前を表し、y軸がプレーヤーの名前を表している場合、異なるプレーヤー(勝ち抜き率が最も高いトップ5またはトップ10プレーヤー)のマッチ・ウィン・ロス率のグラフをプロットすることです。軸はそのプレーヤーの勝敗率を表します。

このグラフを作成するにはどうすればよいですか。私はdplyrパッケージのパイプライニングを次のように使ってみました: WinnerとLoserは階乗変数です。

roger_wins <- atp %>% filter(Winner == "Federer R.") %>% count(Winner) 
roger_loss <- atp %>% filter(Loser == "Federer R.") %>% count(Loser) 

しかし、この方法では、各プレーヤーごとにハードコードする必要があります。私はトップ5またはトップ10プレーヤーのために、この使用してコードを実行するためにどのように これは、データ・セットを見つけることができるページですR. でソリューションを提供してください(損失を勝つために応じて):場合 https://www.kaggle.com/jordangoblet/atp-tour-20002016

+0

他のサイトに人を送り込んでデータをダウンロードするのではなく、dput()を使用してデータの小さなサンプルを貼り付けてください。 – eipi10

答えて

0

Iあなたはこのような何かを行うことができ、あなたの問題を理解する:

  1. その後、あなたはが最初のポイント
  2. 01の出力の上に関数を適用使用できるデータ
  3. を衰弱するテーブル関数を使用
+0

お返事ありがとうございます。私はそれを考え出した。しかし、私はもっと複雑なやり方でそれをやったと感じています。私の分析と私がここで望んでいたことをどうやって管理したかを見ることができます: –

+0

リンク:https://www.kaggle.com/arathee2/d/jordangoblet/atp-tour-20002016/surface-wise-analysis –

関連する問題