「シェイプパラメータ」とはどういう意味ですか?
名前からわかるように、シェイプパラメータはディストリビューションの形状を決定します。これは、形状パラメータがない何であるかを起動するときに説明するのが一番簡単でしょう:
場所パラメータは、分布をシフトしますが、そうでない場合は変更されません。例えば、正規分布の平均は位置パラメータである。 X
が平均値mu
で正規分布している場合、X + a
は平均でmu + a
で正規分布しています。
スケールパラメータは、配信をより広くまたは狭くする。例えば、正規分布の標準偏差はスケールパラメータである。 X
が標準偏差sigma
で正規分布している場合、X * a
は通常標準偏差sigma * a
で配布されます。
最後に、の形状パラメータは、分布の形状を変更します。例えば、Gamma distributionは、分布がどれほど歪んでいるか(どれがどれくらい「片側に傾くか」)を決定する形状パラメータk
を持っています。
しかしa
とk
はに何を指すのでしょうか?
k
は、分布によってパラメータ化された変数です。 zipf.pmf
を使用すると、形状パラメータa
が与えられた場合、任意のk
の確率を計算することができます。以下は、a
が分布の形状(異なるkの個々の確率)をどのように変更するかを示すプロットです。
高いa
低いa
小さなk
k
が可能でありにくく、より大きなする間、k
の大きな値が非常に低いことができます。
alpha
のパラメータは何を意味していますか?それは "信頼区間"ですか?
alpha
が信頼区間であると言うことは間違っています。 信頼水準です。私はそれがあなたが意味するものだと思います。例:alpha=0.95
95%の信頼区間があることを意味します。特定のディストリビューションからランダムなk
を生成すると、そのうちの95%がzipf.interval
によって返される範囲になります。プロットの
コード:
from scipy.stats import zipf
import matplotlib.pyplot as plt
import numpy as np
k = np.linspace(0, 10, 101)
for a in [1.3, 2.6]:
p = zipf.pmf(k, a=a)
plt.plot(k, p, label='a={}'.format(a), linewidth=2)
plt.xlabel('k')
plt.ylabel('probability')
plt.legend()
plt.show()
関連:http://stats.stackexchange.com/questions/269255/is-it-right-to-use-normal-distribution-to-compute信頼区間間隔 – alvas