2016-11-23 5 views
0

私は、次の列を持つデータフレームを持って数える:パンダPyplot:散布図の列

df = pd.read_csv('edtech.csv') 
print(df.head()) 

    Unnamed: 0           Title  Date Country \ 
0   3  Apple acquires edtech company LearnSprout 15-01-16  US 
1   9 LearnLaunch Accelerator launches new program 15-01-16  US 
2   15     Flex Class raises financing 15-01-16 India 
3   16    Grovo raises Series C financing 15-01-16  US 
4   17     Myly raises seed financing 15-01-16 India 

          Segment 
0    Tools for Educators 
1  Accelerators and Incubators 
2 Adult and Continuing Education 
3    Platforms and LMS 
4      Mobile Apps 
>>> 

を、私は1つの軸と別の「セグメント」オン「の国」をマッピングすることにより、散布図を作成したいです。例えば。米国と '教育者のためのツール'では、チャートに1つのドットが表示されます。

このデータフレームをどのように変換すればよいのですか。散布図にレンダリングできる数値がありますか?私は数を介してTableauでチャートを取得することができますが、同じ背後にある正確な作業を知らない。

誰かが私を助けることができたら感謝します。 TIA

+0

プロットする数値は何ですか?国とセグメントはカタロニア語です – kezzos

+0

こんにちは@kezzos私はお互いに彼らの数をプロットしたいです。例えば。米国教育機関向けツール、米国モバイルアプリ向け – chhibbz

答えて

1

2つの非数値カテゴリ変数を持つ散布図が存在する可能性があるかどうかわかりませんが、groupbyでカウントを作成し、pivotでデータを再形成しますheatmapを使用してください。seaborn

import pandas as pd 
import seaborn as sns 

df = pd.read_csv('edtech.csv') 
dd = df[['Country','Segment','Title']] 
gg = dd.groupby(['Country','Segment'],as_index=False).count().rename(columns={"Title":"Number"}) 
gp = gg.pivot(columns="Segment",index="Country",values="Number").fillna(0.0) 
sns.heatmap(gp,cbar=False) 
+0

ありがとう@Khris私が望んでいたものではありませんが、機能しました。カウントのピボットを作成します – chhibbz