2017-03-22 17 views
2

docsscipy.stats.zipfのパラメータは何を意味していますか?

からジップの確率質量関数である:

zipf.pmf(K、A)=> K 1 /(ゼータ(A)* K ** A) を=

zipfは形状パラメータとしてaをとります。

上記の確率質量関数は、「標準化された」形式で定義されています。分布をシフトするには、locパラメータを使用します。具体的には、zipf.pmf(k、a、loc)はzipf.pmf(k-loc、a)と同じです。

しかしakはに何を指すのでしょうか? 「形状パラメータ」とはどういう意味ですか?

さらに、scipy.stats.zipf.intervalには、alphaというパラメータがあります。

.interval()方法の説明は単にある:alphaパラメータが何を意味するの

分布のアルファパーセントが含まれている範囲の

エンドポイント?それは "信頼区間"ですか?

+0

関連:http://stats.stackexchange.com/questions/269255/is-it-right-to-use-normal-distribution-to-compute信頼区間間隔 – alvas

答えて

3

「シェイプパラメータ」とはどういう意味ですか?

名前からわかるように、シェイプパラメータはディストリビューションの形状を決定します。これは、形状パラメータがない何であるかを起動するときに説明するのが一番簡単でしょう:

  1. 場所パラメータは、分布をシフトしますが、そうでない場合は変更されません。例えば、正規分布の平均は位置パラメータである。 Xが平均値muで正規分布している場合、X + aは平均でmu + aで正規分布しています。

  2. スケールパラメータは、配信をより広くまたは狭くする。例えば、正規分布の標準偏差はスケールパラメータである。 Xが標準偏差sigmaで正規分布している場合、X * aは通常標準偏差sigma * aで配布されます。

  3. 最後に、の形状パラメータは、分布の形状を変更します。例えば、Gamma distributionは、分布がどれほど歪んでいるか(どれがどれくらい「片側に傾くか」)を決定する形状パラメータkを持っています。

しかしakはに何を指すのでしょうか?

kは、分布によってパラメータ化された変数です。 zipf.pmfを使用すると、形状パラメータaが与えられた場合、任意のkの確率を計算することができます。以下は、aが分布の形状(異なるkの個々の確率)をどのように変更するかを示すプロットです。

enter image description here

高いa低いa小さなkkが可能でありにくく、より大きなする間、kの大きな値が非常に低いことができます。

alphaのパラメータは何を意味していますか?それは "信頼区間"ですか?

alpha信頼区間であると言うことは間違っています。 信頼水準です。私はそれがあなたが意味するものだと思います。例:alpha=0.95 95%の信頼区間があることを意味します。特定のディストリビューションからランダムなkを生成すると、そのうちの95%がzipf.intervalによって返される範囲になります。プロットの

コード:

from scipy.stats import zipf 
import matplotlib.pyplot as plt 
import numpy as np 

k = np.linspace(0, 10, 101) 

for a in [1.3, 2.6]: 
    p = zipf.pmf(k, a=a) 

    plt.plot(k, p, label='a={}'.format(a), linewidth=2) 

plt.xlabel('k') 
plt.ylabel('probability') 

plt.legend() 
plt.show() 
関連する問題