私は基本的にRからPythonに移行しています。列に基づいてデータフレームのサブセットを作成したかったのです。スタックオーバーフローanswerを調べているうちに、解決策が見つかりました。pandasデータフレームの.locの目的は何ですか
しかし、以下のコードを検討:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(),
'B': 'one one two three two two one three'.split(),
'C': np.arange(8), 'D': np.arange(8) * 2})
df1 = df[df['A'] == "foo"]
df1
df2 = df.loc[df['A'] == "foo"]
df2
DF1とDF2どちらも同じです。
私の質問は:最初はloc
機能の要件は何ですか。私はRの背景とRから来ていることに留意してください。loc
タイプの関数をデータフレームのサブセット化に使用する必要はありません。
[this](http://pandas.pydata.org/pandas-docs/stable/indexing.html#different-choices-for-indexing)と[this](http://pandas.pydata)をお読みください。 org/pandas-docs/stable/indexing.html#indexing-view-versus-copy)さらに質問がある場合は質問を編集してください – EdChum