私は米国のポーリングデータを分析しようとしています。具体的には、どの州が安全か、限界か、タイトであるかを調べようとしています。私は、時間とその「近さ」による調査結果を持つデータフレームを持っています。私はこのパンダのステートメントを使って、「親密さ」の項目の概要を取得しています。Pandasシリーズから行が配列されている行を選択する
s=self.daily.groupby('State')['closeness'].unique()
これは私は、このシリーズ(簡潔にするため図示選択)与えている:行が型配列のものであるので、例えば、s[0]
が与える
State
AK [safe]
AL [safe]
CA [safe]
CO [safe, tight, marginal]
FL [marginal, tight]
IA [safe, tight, marginal]
ID [safe]
IL [safe]
IN [tight, safe]
Name: closeness, dtype: object
を:
array(['safe'], dtype=object)
Iをこのシリーズから選択しようとしていますが、私は構文の権利を得ることができません。例えば、私はこの構文を使用しただけで「安全」の状態を選択しようとしている:
ipdb> s[s == 'safe']
*** ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
これはどちらか動作しません:
test[test == ['safe'])
は、ここで私がやりたいものだ:選択します「限界的」または「緊密」である国は、「安全な」状態と「安全な」状態のみを選択します。誰もが私が使うはずの構文、または最初のより良いアプローチについて考えている人はいますか?
============ はここGROUPBY前のデータのサンプルです:
ipdb> self.daily.head(3)
Date Democratic share Margin Method Other share \
0 2008-11-04 0.378894 -0.215351 Election 0.026861
1 2008-11-04 0.387404 -0.215765 Election 0.009427
2 2008-11-04 0.388647 -0.198512 Election 0.024194
Republican share State closeness winner
0 0.594245 AK safe Republican
1 0.603169 AL safe Republican
'groupby'を実行する前にサンプルデータを投稿できますか? – shivsn
ありがとうshivsn - 質問にサンプルを追加 –