2017-12-01 11 views
1

私が試したさまざまなことをすべてコピーすることはできないので、これは非常に広い質問です。 NYPDの犯罪のこのデータセットから:https://data.cityofnewyork.us/Public-Safety/NYPD-Complaint-Data-Historic/qgea-i56iパンダの大きなデータセットから犯罪計数を取得する

私は、データフレームを作成し、値でそれを埋めるために(DateTimeオブジェクトに文字列と挑発し、変換された)、CMPLNT_FR_DT行を反復処理する

をしようとしていますそれは次のようなもの:

[Date]      [Borough]    [Crime Count]  
01-01-2014 
... 

... 

... 

12-31-2014 

ので、サンプルの行は次のようになります。

05-23-2014 QUEENS  45 

と上のことを表します2014年5月23日、クイーンズで45件の犯罪が発生しました。

私は、より迅速な処理時間のためにデータセットをpickleしました。私はpython pandasライブラリを使用しています。私の問題は、私がCMPLNT_FR_DTを反復するように見えることができないことです。 set_value関数を使用して、NYPD_Historicデータフレームから新しい値に値を設定することもできません。さらに、.iterrows()を使用してボローインシデントをカウントしようとすると、「マルチインデックスでタプルできるだけ」エラーが発生します。どんな助けでも大歓迎です!

+2

あなたのコードを表示して、自分が行っていることをより明確に把握することをお勧めします –

答えて

2

これは、groupbyメソッドを使用するのに非常に良い時期になるようです。 df.groupby(['CMPLNT_FR_DT', 'Borough']).count()を実装すると、同じデータ型である限り、日付の形式に関係なく、同じ日付と地域のすべてのインスタンスの数を含む新しいデータフレームが得られます。

追加メリットとして、これはデータフレーム全体を反復するよりはるかに迅速です。

関連する問題