pandas-groupby

1熱

1答えて

私はデータフレームを持っており、すべてのマーケットプレイスに最大データエントリであるlast_saturdayデータが存在するエントリが存在するかどうかを確認する必要があります。 data = { 'marketplace': [3, 3, 4, 4, 5, 3, 4], 'date': ['2017-11-11', '2017-11-10', '2017-11-07',

1熱

2答えて

Python Pandas合計は日付と説明

私はPython 2.7を使用しています。私は私のデータがどのように見えるように、それぞれの説明と月で合計したい raw_data = {'Date': ['12/1/2016', '12/4/2016','12/23/2016', '1/18/2017','1/18/2017','1/19/2017'], 'Account': ['aa1', 'aa2','aa1', 'aa1', '

1熱

1答えて

groupbyを実装し、groupbyの出力を.csvファイルに挿入したい

私のデータセットに約8781行あります。私は月ごとに異なる項目をグループ化し、毎月の特定の項目の平均を計算しました。今、毎月新しい行を挿入した後、毎月の結果を保存したいと思います。以下は、アイテムをグループ化して平均を計算したコードです。誰もが、毎月新しい行を挿入してgroupbyの結果をそこに格納する方法を教えてください。 a = pd.read_csv("data3.csv") prin

0熱

2答えて

パンダ他の列の値に応じて列の合計を集計する方法

groupbyで列の値を2列目の値に合計しようとしていますが、3列目の値も考慮して、dfは、私は memoが posであれば、それが正と負の、例えばのための neg id和 amountが、各グループでグループ化する id memo amount 1 pos 1.0 1 pos 2.0 1 neg 3.0 2 pos 4.0 2 pos 5.0 2 neg 6.0 2 n

2熱

2答えて

df.value_counts（）とdf.groupby（ '...'）の使用はいつ適切ですか？count（）？

パンダでは同じことをする方法が複数あることがよくありますが、私は不思議に思っていました - 特定の列内の値でデータをグループ化し、値は、いつdf.groupby('colA').count()を使用するのが合理的で、いつdf['colA'].value_counts()を使用するのが理にかなっていますか？

2熱

1答えて

Pandas groupbyが正規表現で不要な要素を連続して捕捉する

これは私の初めての投稿なので、これが私が持っている問題について十分に文書化されていることを願っています。パンダのデータフレームにクリーニングしてロードした25年以上のNOAA風向と速度のデータを使用しています。毎日のみから読み取ることによって、それをグループ化し、 in: july_df = df[df['date'].str.contains('\d{4}\-(7|07)', regex=Tr

0熱

1答えて

PYのDFのGROUPBYは、「商品コード」

が、私は列のグループDFに必要な文字列に値を取得し、それ Input dataframe looks like this で重複を避け、文字列として「コンボ」から「機能」から結果の値を移入し、 Resulting dataframe should look like this 私は df['Combo']=pd.Series(df.groupby('ProductID')['Feature'])を

2熱

2答えて

Pandas Dataframeで間隔とカウントの出現が見つかりました。

私は、混在するさまざまなイベントのリストを取得しました。たとえば、イベント1が3回発生した後、別のイベントが発生し、その後イベント1が再び発生します。私が必要とするのは、各イベントの間隔とその間隔でのイベントの発生数です。 values = { '2017-11-28 11:00': 'event1', '2017-11-28 11:01': 'event1',

2熱

2答えて

Pandas Pythonでグループ化して並べ替え

私はグループごとに機能を実行しましたが、これを月単位で並べ替えたいのですが、どのようにすればいいですか？現在、この関数は、アルファベット順にソートされた月： func = {'Predictions':['count','mean','median']} table1 = df.groupby(['FLAG','MONTH']).agg(func) TABLE1 Predictions

1熱

3答えて

のみ特定の値を表示

にパンダとのグラフをプロット私は別のデータフレームから2列が含まれてデータフレームを作成した： df1 = df[["BNF Chapter", "Name"]] df1 これは、2つの列を有するデータフレームを示します。私は、各章ごとに、その特定の章の薬剤名を表示するように、グループごとに機能を実行しました。 df1.groupby（['BNF Chapter'、 'Name']）['BN