2017-11-26 22 views
0

x軸が距離であるggplotを作成したい(現在の距離は0〜45フィートの連続した値)バスケットが作られたかどうか(0が欠けている、1が作られている)です。ここには、パンダのデータフレームであるデータフレームのサブセットがあります。編集:これは便利ですが、私はまた、各試行のショット距離のバケット/ビンを表す列を追加しました。非離散型のxとyを使ったggplotでのプロット

distance(ft) outcome  category 
----------- --------- -------- 
9.5   1   (9,18] 
23.3   1   (18,27] 
18.7   0   (18,27] 
10.8   0   (9,18] 
43.6   1   (36,45] 

私はちょうどx軸が距離でy軸がミス/作成されている散布図を作ることができます。しかし、私はすべてのショットの試行をポイントとして視覚化したくありません。私はx軸をビンにしたいとしましょう(各ビンは9フィートごとに0-9フィート、9-18フィート、18-27フィート、27-36フィート、36-45フィート)、yはそのビンで行われたショットの割合。

ggplotでこれを達成する最良の方法は何ですか? ggplotの機能を活用する前に、どれだけの前処理が必要ですか?ビンごとのショットの割合を見つけてそれらの値を簡単にプロットするために、必要な計算を自分ですべてやっていると想像してもらえますが、これを手伝うための組み込みの機能があるはずです(ggplotには新しく、この時点で)。どんな指針も大変ありがとうございます。ありがとう!

答えて

-1

あなたのデータを保持するためにパンダのデータフレーム(またはシリーズ)を使用している可能性はありますか?

この場合、値using Pandas in-built functionality、具体的にはthe pandas.cut functionをビンすることができます。

bins = 9 # can be int or sequence of scalars 
out, bins = df.cut(data, bins, retbins = True, include_lowest = True) 
+0

はい、私はそうです。それを指摘してくれてありがとう!ビンニング後、各ビン内での比率をどのようにして見つけることができますか(ビン内での比率は、そのビン内の1または0を超える割合になります)。 –

+0

それはあなたのデータ構造に依存するでしょう - いくつかのより多くの情報で新鮮な質問をしてください。 これで問題が解決した場合は、回答としてマークしてください。 –

+0

恐ろしい!私は、この質問自体にビンを追加した後、パンダのデータフレームの様子を更新しました。私は各ビンの割合を見たいと思います。 –

関連する問題