2017-06-22 8 views
-2

これは基本的な疑問です。私はパンダでcsvファイルを読み込んでいます。このファイルには、性別を含むいくつかの見出しの下に文章メタデータがあります。私は男女別に男女を区別し、それぞれのインスタンスを数え、性別データのすべてをGENDER見出しの下から抜き出したいと思います。助けて?パンダでロードしたcsvから列のデータを取得するには

+0

'df.loc [:、 'GENDER'] ' – BallpointBen

+0

は何か試しましたか?例?出力はどのように見えますか? – gobrewers14

+0

パンダのチュートリアル[here](https://pandas.pydata.org/pandas-docs/stable/tutorials.html)の一部を行うべきだと思います – jacoblaw

答えて

1

あなたが望むような音:

gender,firstname,lastname,bookname 
male,homer,simpson,black and white 
female,marge,my family 
male,bart,simpson,my first book 
female,lisa,simpson,jazz in my life 
female,margaret,i am baby 

そして、あなたはすべてを引き出したい:あなたには、いくつかのCSV、例を持っている場合は

df['GENDER'].value_counts() 
0

をより多くの情報が必要ですが、...性別データのうち、試してみます:

import pandas 

# read source csv 
# gender,firstname,lastname,bookname 
df = pandas.read_csv('source.csv') 

# male's data 
print("data from males") 
print(df.where(df['gender'] == 'male').dropna().to_string(index=False)) 

# female's data 
print("data from females") 
print(df.where(df['gender'] == 'female').dropna().to_string(index=False)) 

# statistic by gender 
print("gender statistic") 
print("males: {}".format(df['gender'].where(df['gender'] == 'male').count())) 
print("females: {}".format(df['gender'].where(df['gender'] == 'female').count())) 

data from males 
gender firstname lastname   bookname 
male  homer simpson black and white 
male  bart simpson my first book 
data from females 
gender firstname lastname   bookname 
female  lisa simpson jazz in my life 
gender statistic 
males: 2 
females: 3 

しかし、私はあなたを正しく理解しているとは確信していません。

関連する問題