2016-04-28 9 views
0

私はgenresという名前の列を持つデータフレームを持っています。各ジャンルにはムービー名として複数の値があります。フォーマットは以下の通りである:私はmovie_valに基づいて、ジャンルのそれぞれをGROUP_BYし、クラスタのような散布図内の各グループをプロットする必要がPython:Pandasのgroup_by関数を使った散布図

Movie_val Genre 
     2  Fantasy 
     11  Adventure 
     12  Comedy 
     2  Fantasy 
     2  Adventure 
    11  Adventure 
    13  Thriller 
    12  Fantasy 
    10  Thriller 
    11  Drama 
    1  Fantasy 

(例:別の1つのクラスタや色、冒険中にアクションジャンルの映画、など)。私はmatplot libライブラリをチェックし、クラスタグラフの2つの値XとYを期待しています。私のgroup_byコマンドには多くのムービー値があります(例:冒険ジャンルには多くの値があり、グループとして値をプロットする方法がわかりません)。

また、これらのgroup_by値はそれぞれ異なる色で表示する必要があります。 私は棒グラフの下のコードを試しました。しかし、以下のフォーマットは散乱を許さないので、私は散乱1を探しています。

 result = df.groupby(['genres'])['Movie_val'].quantile(0.5) 
    result.sort_values().plot(kind='barh') 

私はこれをpandasライブラリを使用してPythonで試しています。どんな助けでも大歓迎です。

答えて

0

海底の図書館は、おそらくあなたが何をしているのかを示すことができます。もちろん、散布図の座標を提供するデータフレームの列を選択する必要があります。

import seaborn as sns 
g = sns.FacetGrid(df, hue="Genre", size=5) 
g.map(plt.scatter, "column name for x dimension", "column name for y dimension", s=50, alpha=.7) 
g.add_legend(); 

は、ここでは、より複雑なファセットを持つ例も参照してください: https://stanford.edu/~mwaskom/software/seaborn/tutorial/axis_grids.html

+0

私はグループのジャンルにGROUP_BY機能を使用していますが、それは単一のグループに複数の値を持つことになります。私の場合、値として12を持つmovie_valueは1つの軸で使用でき、複数のジャンルがあり、別の軸でプロットする必要があります。私はこれがどうして起こるか知る必要があります。私は上記のように私のgroup_byコマンドに言及しているし、プロットする必要があります – SRS