私は解決できない質問があります。あなたが私を助けることができるかどうかを見てみましょう。私はCOL名内の名前でグループ化したいと私はこれをやった後、私は最近、グループによってCOL 2にCOL 1の値を割り当てると仮定しパンダでのグループ分けの値の割り当て
df = pd.DataFrame(np.random.randint(0,3,size=(7, 4)),columns=['ONE', 'TWO', 'NAMES', 'FOUR'],index = fechas)
df['NAMES'] = ['Peter','Jon',' Mary','Mary','Peter','Peter','Mary']
:
私はこのDFを持っています行われ、COL 4
の最初の0を持っている私は名前でグループ全体へのcol 1の要素の値を割り当てる必要が基準以下これは私が
ONE TWO NAMES FOUR
1970-01-01 0 0 Peter 0
1970-01-02 2 1 Jon 0
1970-01-03 1 0 Mary 0
1970-01-04 1 1 Mary 0
1970-01-05 0 2 Peter 1
1970-01-06 2 2 Peter 0
1970-01-07 0 0 Mary 1
得たもので、私は次のようなものが必要です:
ONE TWO NAMES FOUR
1970-01-01 0 0 Peter 0
1970-01-02 2 1 Jon 0
1970-01-03 1 1 Mary 0
1970-01-04 1 1 Mary 0
1970-01-05 0 0 Peter 1
1970-01-06 2 0 Peter 0
1970-01-07 0 1 Mary 1
私はそれがすべてうまく説明されることを願っています。 は、私はあなたがboolean indexing
により、すべての列FOUR
で0
と行と最初の値を保持して、その後drop_duplicates
NAMES
によって列を第一のフィルタが必要だと思うあなた
私は巨大なDFを持っている、と私は1つの列の値でグループを作りたいです。次に、グループのどの要素に別の列に60000という要素があるかチェックします。その要素は、別の3番目の列から別の4番目の列に値を渡す「父」になります。解説が難しい場合は –
を説明するのは難しいですが、あなたはまだその質問をする準備ができていません。 – DSM
@jezraelはちょうどロジックを持っていますが、彼のコードはうまく動作しません。 –