私はpandasを使用してExcelファイルを読み込み、スプレッドシートをデータフレームに変換しています。それから、私はgroupbyを適用し、後で計算するためにget_groupを使って個々のグループを変数に格納します。 私の問題は、入力ファイルが常に同じサイズではないことです。時にはgroupbyが10個のdfs、時には25個などになることがあります。dfが最初のデータから欠落している場合、私のプログラムは無視しますか?pandas groupbyオブジェクトに不足しているデータフレームを無視させます
df = pd.read_excel(filepath, 0, skiprows=3, parse_cols='A,B,C,E,F,G',
names=['Result', 'Trial', 'Well', 'Distance', 'Speed', 'Time'])
df = df.replace({'-': 0}, regex=True) #replaces '-' values with 0
df = df['Trial'].unique()
gb = df.groupby('Trial') #groups by column Trial
trial_1 = gb.get_group('Trial 1')
trial_2 = gb.get_group('Trial 2')
trial_3 = gb.get_group('Trial 3')
trial_4 = gb.get_group('Trial 4')
trial_5 = gb.get_group('Trial 5')
私の最初のデータのみ3つの試験があり、どのように私はそれを後で裁判4、5を無視するようになるだろう?と言いますか私のコードは、すべての試験が存在する場合に実行されますが、いくつかの文が必要とされるであろう場合、それは非常に多くのように聞こえるが、私の疲れた脳は事前に...
ありがとう!
'ギガバイト.groups'はグループ名とラベルの辞書を返します:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.core.groupby.GroupBy.groups.html soあなたはグループを取得するためにこれらを使用することができます – EdChum
愚かな質問には申し訳ありませんが、どうすればそれが役に立ちますか? – ElHi
グループ内のグループ数をハードコードする必要はありませんので、 – EdChum