0
を取る:行のパンダは合計で変換私は整数値の次の列を持っているパンダのデータフレームを持っているが長すぎる
user_id, user_agent_id, appearances
数は異なりますが、彼らは410万以上です。私は、各ユーザーのすべての出現の合計である新しい行の出現を作成したいと考えています。だから私は、次の手順を実行します
私はdataframe['percent'] = dataframe['appearances']/dataframe['total_appearances']
あるユーザーごとuser_agent_idのあたりの割合を計算したいので、私はパーセント
の最大値を計算するために同じことを行うことを必要とするdataframe['total_appearances'] = dataframe['appearances'].groupby(dataframe['user_id']).transform('sum')
dataframe['max_percent'] = dataframe['percent'].groupby(dataframe['user_id']).transform('max')
など
事があるのに対し変換方法のトンのmax方法aks約5mの合計メソッドは2秒以上の時間がかかります。これは自然ですか? total_appearances
の情報を入手するためのより迅速な方法はありますか?
'a'メソッドとは何ですか?列名が残念です。また、私は列の名前にparanthesisを使用してこの構文を見たことがない。 – Apostolos
私はパーセンテージの計算に問題はありませんが、出現総数の列はありません。変換は問題です:)。しかし、私は確認し、あなたに戻ってくる – Apostolos
括弧上の名前が予想されるエラー。たぶんあなたはメソッドの呼び出しを見逃していますか? – Apostolos