2017-03-15 12 views
1

私はパンダに見られるいくつかの例で混乱します。例えばこれは、私が最近読んポストから短縮されます。パンダの構文例混乱

df[df.duplicated()|df()]

を私は理解していない何dfが外側にあることが必要である理由です:df[df.duplicated()] だけdf.duplicated()を使用して対。最初の例をまだ見ていないドキュメントでは、すべてがdf.something_doing()の形式で表示されています。しかし、私はdf[df.something_doing()]のような多くの例を見て、私は外側のdfが何を理解していません。

答えて

2

df.duplicated()はブール値を返します。上記の条件が満たされればTrueをマスクし、それ以外の場合はFalseを返します。 あなたはブールマスクに基づいてデータフレームのスライスをしたい場合は、あなたが必要とする:あなたが唯一の「ID」である列をしたい場合は

df[df.duplicated()] 

別の簡単な例として、このデータフレーム

col1 id 
0 1  a 
1 0  a 
2 1  a 
3 1  b 

を考えます'A'、

df.id == 'a' 

はあなたにブールマスクが、

を与えるだろう

は、データフレームを返します。

col1 id 
0 1  a 
1 0  a 
2 1  a