2017-11-21 7 views
0

私はすべての文字列ラベルの出現をリストしたpython配列を持っています。 labels_arrayと呼ぶことにしましょう。 私はこの配列のcountplotを表示したいdはSNSとしてseabornを使用する:Seaborn Countplot:最も頻度の高いn個のカテゴリのみを表示する

sns.countplot(labels_array) これは動作しますが、彼らは私の配列であまりにも多くの異なるラベルであるとして、outpoutは良く見えるdoesntの。

最も頻繁に表示されるn個のラベルのみを表示する方法はありますか。

答えて

0

countplotは、原則としてカウントを知っている必要があり、したがってその一部のみを表示する必要がありますが、そうではありません。したがって、カウントプロットの使用はあまり意味をなさないかもしれません。

代わりに通常のパンダプロットを使用してください。例えば。

import string 
import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

l = list(string.ascii_lowercase) 
n = np.random.rand(len(l)) 
a = np.random.choice(l, p=n/n.sum(),size=400) 

s = pd.Series(a) 
s.value_counts()[:5].plot(kind="bar") 

plt.show() 

pandas.Series(labels_array).value_counts()[:5].plot(kind="bar") 

完全な例は、リスト内の5つの最も頻繁にアイテムを表示します

関連する問題