2016-11-06 3 views
1

私はPythonを使用していますが、プレイしたチーム名と試合日数のデータがあります(数百行は例外です)。python - 最近の10日間のインジケータを追加

 team date 
0  TOR  2016/10/15 
1  LAK  2016/10/20 
2  CGY  2016/11/03 
3  BUF  2016/10/30 
4  PIT  2016/10/27 
5  CHI  2016/11/05 
6  VAN  2016/10/20 
7  BUF  2016/10/16 
8  STL  2016/10/13 
9  BUF  2016/10/29 
10 MIN  2016/10/29 
11 PIT  2016/11/05 
12 CHI  2016/10/18 
13 BOS  2016/10/29 
14 PIT  2016/10/20 
15 COL  2016/10/20 
16 MTL  2016/10/20 
17 MTL  2016/11/05 
18 BOS  2016/11/03 
19 EDM  2016/11/05 
20 NSH  2016/11/01 

私は各チームの最新の10のゲームだけでなく、各チームの最新の5つのゲームであるかを示すために、インジケータの列を追加したいと思います。彼らがこのグループにいるならば1で、そうでなければ0である。

私は困惑しています。どんなアイデアでも大歓迎です!

+0

はあなたの所望の出力を表示することができ、あなたはどのようなコード試してみましたか? – IanS

答えて

1

は、私はあなたがisinによってインデックスを選択するためのnumpy.whereSeriesGroupBy.nsmallestを使用することができると思う:

df.date = pd.to_datetime(df.date) 
#in real data use nsmallest(10) 
idx = df.groupby('team')['date'].nsmallest(2).index.get_level_values(1) 
df['indicator'] = np.where(df.index.isin(idx), 1, 0) 

print (df) 
    team  date indicator 
0 TOR 2016-10-15   1 
1 LAK 2016-10-20   1 
2 CGY 2016-11-03   1 
3 BUF 2016-10-30   0 
4 PIT 2016-10-27   1 
5 CHI 2016-11-05   1 
6 VAN 2016-10-20   1 
7 BUF 2016-10-16   1 
8 STL 2016-10-13   1 
9 BUF 2016-10-29   1 
10 MIN 2016-10-29   1 
11 PIT 2016-11-05   0 
12 CHI 2016-10-18   1 
13 BOS 2016-10-29   1 
14 PIT 2016-10-20   1 
15 COL 2016-10-20   1 
16 MTL 2016-10-20   1 
17 MTL 2016-11-05   1 
18 BOS 2016-11-03   1 
19 EDM 2016-11-05   1 
20 NSH 2016-11-01   1 
+0

'ARI'チームはサンプルではありませんが、最後の行' NSH'チームとお考えですか?出力が間違っていますか? top2はどこですか? – jezrael

+0

だから私だけでトップ2を探して、これを試みたが、ここで私は1つのチームのために得たものである: '' ' チーム日付last2 17 ARI 2016年11月1日1 49 ARI 2016年11月3日0 29 ARI 2016-10-15 1 21 ARI 2016-10-27 1 41 ARI 2016-11-04 0 16 ARI 2016-10-25 0 31 ARI 2016-10-21 1 34 ARI 2016-10 -29 1 35 ARI 2016-10-20 0 40 ARI 2016-10-18 1 41 ARI 2016-10-23 0 '' ' この表の索引はナンセンスであると述べておきます。私はそれ以来それを削除しました。 – pixiesweet44

+0

私が元の質問に投稿したのは、それがどのように見えるかを知るために、20行のサンプル出力でした。実際には、350行あります。 NSHはARIと同様の出力を示した。 – pixiesweet44

関連する問題