pandas-groupby

    0

    1答えて

    私は、パンダの2つのデータフレームを適切に結合しようとしています。その結果、最終的に正しいインデックスと列を持つことができます。 私のデータフレームは、この DF1 次のようになり DF2 merged_df merged_dfがあるだけでDF1(同じインデックスと同じ単語列)を除いて、それはまた、各単語の値を与える右側の値の列を持っています。 単語がdf2にない場合は、merged_dfにNaN

    0

    1答えて

    CSVデータを持つグループを作成するコードがあり、そのグループで新しいファイルを作成することもできます。 私のCSVファイルを読み、それを使って作業しました。私の目的球が動作し、データを使用して新しいファイルを作成するときに問題があり、新しいファイルの名前は、グループの名前であり、私はそれをしたいドント:私が完了したときに ID Inventory Domain Requests Im

    1

    1答えて

    私は1日あたりの値を持つデータフレームを持っています(以下のdfを参照)。 "Forecast"フィールドを週単位でグループ化したいが、月曜日を週の最初の曜日としてグループ化したい。 現在、私はpd.TimeGrouper( 'W')を介してそれを行うことができます(下記df_finalを参照)が、それはグループの日曜日に始まる週(以下df_finalを参照) import pandas as p

    0

    1答えて

    I番号に基づいて2つの列をソートし 881 X 497 Y X 2400 Y 2556 Zを入力する必要 1748 x 443y 217 Z 1024 Y 現在のコードスニペット:このタイプ(X、Y、Z)で import pandas as pd data1 = pd.read_csv('data/extracted.csv') data2 = data1.sort(['Res

    1

    1答えて

    私は自分のデータを分析するためにパンダを使用しています。私はelapsed_secondsとm(マグニチュード)から成るこのデータフレームを持っています。浮動小数点数(elapsed_seconds)の5桁でグループ化し、mの平均を見つける方法はありますか? 例: elapsed_seconds,m 10769.001,0.373637934043 10769.027,0.3734032948

    0

    1答えて

    私はpandasにgroupbyを使用しましたが、グループのラベルは単に任意の値ですが、このラベルをインデックスにします私はdatetimeの面でプロットすることができます新しいデータフレームを作成することができます元のデータフレーム(datetime)です。 grouped_data = df.groupby( ['X',df.X.ne(df.X.shift()).cumsum().

    1

    2答えて

    異なるタイプの複数の行をpandasに統合することを検討しています。私は.groupby()パラメータを持っています:['ID']。列['A']は、['ID']でグループ化した場合に値を繰り返したり、各行のデータが異なります。列['B']は、単に.sum()を介して集計する必要があります。新しいデータフレームに 1に最適な方法は何 input_df ID A B 140-1 Apple

    1

    1答えて

    と 私は30日の時系列のウィンドウにリサンプリングしたい以下の一般的な形式でデータを持っている: 'customer_id','transaction_dt','product','price','units' 1,2004-01-02,thing1,25,47 1,2004-01-17,thing2,150,8 2,2004-01-29,thing2,150,25 3,2017-07-1

    1

    2答えて

    私はユーザーの取引をパンダのリストに集約したいと思います。私は、複数のフィールドで構成されるリストを作成する方法を理解できません。私は print(df.groupby('user')['time'].apply(list)) をすれば、私は をすれば、私は user 1 [20, 10] 2 [11, 18] 3 [15] しかしを取得 amount time user 0 1

    0

    1答えて

    私は 'イベント' id event_type_1 event_type_2 event_type_3 234 0 1 0 234 1 0 0 345 0 0 0 と呼ばれるこのデータセットを持っていると私は私が event.groupby('id').sum() を使用してみましたが、それはただ id event_type_1