2016-08-24 7 views
1

Seaborn kdeplotのサンプルを自分のデータセットで動作させようとしています。何らかの理由で、私のデータセットの1つが全くプロットされていませんが、もう1つはうまくプロットしているようです。最小の実例を得るために、私は非常に大きなデータセットからわずか10行しかサンプリングしていません。Seaborn kdeplotはデータをプロットしていませんか?

私の入力データは、次のようになります。

はなぜデータフレームdfAからのデータが実際にプロットされていません。

#Dataframe dfA 
    index x  y  category 
0 595700 5 1.000000 14.0 
1 293559 4 1.000000 14.0 
2 562295 3 0.000000 14.0 
3 219426 4 1.000000 14.0 
4 592731 2 1.000000 14.0 
5 178573 3 1.000000 14.0 
6 553156 4 0.500000 14.0 
7 385031 1 1.000000 14.0 
8 391681 3 0.999998 14.0 
9 492771 2 1.000000 14.0 

# Dataframe dfB 
    index x  y  category 
0 56345 3 1.000000 6.0 
1 383741 4 1.000000 6.0 
2 103044 2 1.000000 6.0 
3 297357 5 1.000000 6.0 
4 257508 3 1.000000 6.0 
5 223600 2 0.999938 6.0 
6 44530 2 1.000000 6.0 
7 82925 3 1.000000 6.0 
8 169592 3 0.500000 6.0 
9 229482 4 0.285714 6.0 

私のコードスニペットは、次のようになりますか?

+2

あなたは1つの軸オブジェクトを作成し、両方を同じ(または軸を持たない図形指向のプロット)にするだけですか? '' f、axarr = plt.subplots(2) '' '' '' '' 'sns.kdeplot(dfA.x、dfA.y、 cmap ="レッズ "、シェード= True、shade_lowest = False、ax shade = True、shade_lowest = False、ax = axarr [1]) '' '' '' '' '' '' ''ブルース " – sascha

+1

私は両方を同じ軸にプロットしようとしています。しかし、私が2番目のプロットコメントをコメントアウトしても、dfAはプロットされません – Joe

答えて

1

gaussian KDEはいずれのデータセットにも適していません。あなたは、離散値を持つ変数と、大多数の値が定数のように見える1つの変数を持っています。これは、二変量ガウス分布によってよくモデル化されていません。

完全なデータセットがなければ、私は確かに言えませんが、KDEの帯域幅(特にy軸)は非常に狭くなって、無視できない密度の領域小さな。あなたはより広い帯域幅を設定しようとすることができますが、私の助言は、このデータのために別の種類のプロットを使用することです。

関連する問題