2017-11-03 19 views
0

私は都市の列を含むデータフレームを持っています。私はその地域と街を一致させることを望んでいます。たとえば、サンフランシスコは、西となります。ここでPythonは都市、州、地域のリストを取得します

は私のオリジナルデータフレームです:

ここ
data = {'city': ['San Francisco', 'New York', 'Chicago', 'Philadelphia', 'Boston'], 
    'year': [2012, 2012, 2013, 2014, 2014], 
    'reports': [4, 24, 31, 2, 3]} 
df = pd.DataFrame(data, index = ['Cochice', 'Pima', 'Santa Cruz', 'Maricopa', 'Yuma']) 
df 

city   year reports 
San Francisco 2012 Cochice 
New York  2012 Pima 
Chicago  2013 Santa Cruz 
Philadelphia 2014 Maricopa 
Boston   2014 Yuma 

私は州によって領域を含むデータを引き出します。しかし、それは都市を含んでいません。

pd.read_csv('https://raw.githubusercontent.com/cphalpert/census-regions/master/us%20census%20bureau%20regions%20and%20divisions.csv') 

都市ごとの州を取得するにはどうすればよいですか?こうすることで、元のデータフレームに状態を​​含む2番目のデータフレームを結合することができます。

答えて

1

this Github projectには、作成者がアメリカのすべての都市と州を含むと主張するCSVがあります。

次のデータが提示されています

City|State short name|State full name|County|City Alias Mixed Case 

例:

San Francisco|CA|California|SAN FRANCISCO|San Francisco 
San Francisco|CA|California|SAN MATEO|San Francisco Intnl Airport 
San Francisco|CA|California|SAN MATEO|San Francisco 
San Francisco|CA|California|SAN FRANCISCO|Presidio 
San Francisco|CA|California|SAN FRANCISCO|Bank Of America 
San Francisco|CA|California|SAN FRANCISCO|Wells Fargo Bank 
San Francisco|CA|California|SAN FRANCISCO|First Interstate Bank 
San Francisco|CA|California|SAN FRANCISCO|Uc San Francisco 
San Francisco|CA|California|SAN FRANCISCO|Union Bank Of California 
San Francisco|CA|California|SAN FRANCISCO|Irs Service Center 
San Francisco|CA|California|SAN FRANCISCO|At & T 
San Francisco|CA|California|SAN FRANCISCO|Pacific Gas And Electric 
Sacramento|CA|California|SACRAMENTO|Sacramento 
Sacramento|CA|California|SACRAMENTO|Ca Franchise Tx Brd Brm 
Sacramento|CA|California|SACRAMENTO|Ca State Govt Brm 

私はあなたが状態が特定の都市与えられ、この場合には(必要な情報を抽出するために、上記のファイルを解析示唆)あなたはあなたが持っている他のCSVの領域と相関します。

本当に必要な情報のみを含むようにアクセスするすべてのcsvを使用して独自のテーブルを作成する方がよいでしょう。

関連する問題