pandas-groupby

    1

    1答えて

    私はデータフレームを持っており、すべてのマーケットプレイスに最大データエントリであるlast_saturdayデータが存在するエントリが存在するかどうかを確認する必要があります。 data = { 'marketplace': [3, 3, 4, 4, 5, 3, 4], 'date': ['2017-11-11', '2017-11-10', '2017-11-07',

    1

    2答えて

    私はPython 2.7を使用しています。私は私のデータがどのように見えるように、それぞれの説明と月で合計したい raw_data = {'Date': ['12/1/2016', '12/4/2016','12/23/2016', '1/18/2017','1/18/2017','1/19/2017'], 'Account': ['aa1', 'aa2','aa1', 'aa1', '

    1

    1答えて

    私のデータセットに約8781行あります。私は月ごとに異なる項目をグループ化し、毎月の特定の項目の平均を計算しました。今、毎月新しい行を挿入した後、毎月の結果を保存したいと思います。 以下は、アイテムをグループ化して平均を計算したコードです。 誰もが、毎月新しい行を挿入してgroupbyの結果をそこに格納する方法を教えてください。 a = pd.read_csv("data3.csv") prin

    0

    2答えて

    groupbyで列の値を2列目の値に合計しようとしていますが、3列目の値も考慮して、dfは、私は memoが posであれば、それが正と負の、例えばのための neg id和 amountが、各グループでグループ化する id memo amount 1 pos 1.0 1 pos 2.0 1 neg 3.0 2 pos 4.0 2 pos 5.0 2 neg 6.0 2 n

    2

    2答えて

    パンダでは同じことをする方法が複数あることがよくありますが、私は不思議に思っていました - 特定の列内の値でデータをグループ化し、値は、いつdf.groupby('colA').count()を使用するのが合理的で、いつdf['colA'].value_counts()を使用するのが理にかなっていますか?

    2

    1答えて

    これは私の初めての投稿なので、これが私が持っている問題について十分に文書化されていることを願っています。 パンダのデータフレームにクリーニングしてロードした25年以上のNOAA風向と速度のデータを使用しています。毎日のみから読み取ることによって、それをグループ化し、 in: july_df = df[df['date'].str.contains('\d{4}\-(7|07)', regex=Tr

    0

    1答えて

    が、私は列のグループDFに必要な文字列に値を取得し、それ Input dataframe looks like this で重複を避け、文字列として「コンボ」から「機能」から結果の値を移入し、 Resulting dataframe should look like this 私は df['Combo']=pd.Series(df.groupby('ProductID')['Feature'])を

    2

    2答えて

    私は、混在するさまざまなイベントのリストを取得しました。たとえば、イベント1が3回発生した後、別のイベントが発生し、その後イベント1が再び発生します。 私が必要とするのは、各イベントの間隔とその間隔でのイベントの発生数です。 values = { '2017-11-28 11:00': 'event1', '2017-11-28 11:01': 'event1',

    2

    2答えて

    私はグループごとに機能を実行しましたが、これを月単位で並べ替えたいのですが、どのようにすればいいですか?現在、この関数は、アルファベット順にソートされた月: func = {'Predictions':['count','mean','median']} table1 = df.groupby(['FLAG','MONTH']).agg(func) TABLE1 Predictions

    1

    3答えて

    にパンダとのグラフをプロット私は別のデータフレームから2列が含まれてデータフレームを作成した: df1 = df[["BNF Chapter", "Name"]] df1 これは、2つの列を有するデータフレームを示します。私は、各章ごとに、その特定の章の薬剤名を表示するように、グループごとに機能を実行しました。 df1.groupby(['BNF Chapter'、 'Name'])['BN