2017-09-13 12 views
0

私はpandasを初めて使っています。私は自分のcsvファイルを合計しようとしています。私はCountryとCountの列を持つCSVを作成し、各国の合計数を合計するためにパンダを使用します。私は正しく変換されたかどうか私のCSVフォーマットについてもわかりません。これは私のコードパンダを使ってCSVファイルの合計を計算しようとすると、うまくいきません。

import pandas as pd 
df =pd.read_csv ("/Users/mani/Desktop/finalgeocount.csv") 
print df.groupby(['COUNTRY']).sum() 

である。これは

COUNTRY COUNT 

China 1 
China 1 
China 1 
China 2 
Ireland 1 
China 3 
Moldova 1 

私の生のcsvファイルのデータである私は、このような出力が必要です。

China   8 
Ireland   1 
Moldova   1 

をしかし、私の出力は以下のように表示されます。

      Unnamed: 2 Unnamed: 3 Unnamed: 4 
COUNTRY              
Albania       NaN   NaN   NaN 
Algeria       NaN   NaN   NaN 
Angola        NaN   NaN   NaN 
Anguilla       NaN   NaN   NaN 
+0

df.columnsの出力は何ですか? – Vaishali

+0

あなたのコードはうまくいくはずです。正確な問題は何ですか? –

+0

@TedPetrou私は私のポストで私の現在の出力を更新しました。 – Angeline

答えて

1

あなたが作成した生データstedはタブ区切りで、CSV形式です。ファイルを読むとき、デリミタを指定するのに役立ちます:

>>> df = pd.read_csv('/Users/mani/Desktop/finalgeocount.csv', delimiter='\t') 
>>> df 
    COUNTRY COUNT 
0 China  1 
1 China  1 
2 China  1 
3 China  2 
4 Ireland  1 
5 China  3 
6 Moldova  1 
>>> df.groupby('COUNTRY').sum() 
     COUNT 
COUNTRY  
China  8 
Ireland  1 
Moldova  1 

N.B. 2番目の空白行に浮遊文字を取り除くために生データを少し整理しなければなりませんでした。

関連する問題