1950年以来、NBAのすべてのプレイヤーのデータセットとその統計データを持っています。データセットの列は、該当年であるYearと、プレイヤー名とチームその年のNBAでの年間、および彼のキャリアの毎年の各選手のための異なる統計の20の列。列の1つは「PTS」で、プレーヤーがその年に得点した合計点数です。 Pythonで散布図を作成して、x軸に年1950〜2017年を示し、y軸にその年に得点を合計します。パンダデータフレーム内の集約された列のPython散布図
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
seasons = pd.read_csv('C:/windows/temp/Seasons_Stats.csv')
tp_yr = seasons.groupby('Year').agg({'PTS': ['sum']})
しかし、使用して散布図を作成:
tp_yr.plot.scatter(x= 'Year', y = 'PTS', s = 'None', c='red')
リターン:
KeyError: 'Year'
と空白のグラフを私は季節ごとの合計点を返すために最も効率的な方法があると信じて 私は赤い散布図で表される1950年-2017年からのすべての年の合計点を求めます。
「私は問題を抱えているが、」十分な問題の説明ではありません。具体的にする:データフレームの列は何ですか?最後のプロットは何を示しますか(xaxisとは何ですか、yaxisとは何ですか、ポイントは何を表しますか)、あなたはそのようなプロットを作成しようとしましたか?何が問題ですか?どの程度まであなたの期待に合っていないのですか?それともエラーがありますか?あなたが見ることができるように、開いている質問のリストはあなた自身の質問よりも長いです。それを答えるように[編集]してください。 – ImportanceOfBeingErnest
ありがとうございました投稿を編集してより明瞭にしました –
「年」列を変換すると、投稿したエラーが解決します。 (参考:https://stackoverflow.com/questions/35432918/scatter-plot-with-string-x-and-y-coordinates) その他の質問に答えるには、コードをもう少し表示する必要があります。 – mimre