zipf

2熱

1答えて

Zipf Distribution：Python/Numpyを使ってZipf Distributionを測定するには

私は、それぞれの行に-で区切られた約700行のファイル（corpus.txtと言う）を持っています。たとえば： 86-55-267-99-121-72-336-89-211 59-127-245-343-75-245-245 まず私は、ファイルからデータを読み取り、各番号の周波数を見つけ、これらの数字のジップ分布を測定して、分布をプロットする必要があります。私は仕事の最初の2つの部分をやった

0熱

1答えて

matplotlib、FITTED-LINEでZipf配布を構築する

私はzipfディストリビューションをその組み合わせで実行する段落のリストを持っています。私のコードは以下の通りです： from itertools import * from pylab import * from collections import Counter import matplotlib.pyplot as plt paragraphs = " ".join(targ

0熱

1答えて

Zipf_plot（）：2つのオブジェクトを1つのグラフで比較する方法は？

私は、tmパッケージのZipf_plot関数を使って、2つの異なるドキュメント用語行列を比較しようとしています。私はR専門家ではありません。両方に適合する方法があれば教えてくださいこの機能は？私が知っている Zipf_plot(x, type = "l", ...) 、1つのウィンドウでそれらの両方（またはそれ以上）を取得する可能性があります： par(mfrow=c()) が、私は1つ

2熱

1答えて

scipy.stats.zipfのパラメータは何を意味していますか？

docs からジップの確率質量関数である： zipf.pmf（K、A）=> K 1 /（ゼータ（A）* K ** A）を= zipfは形状パラメータとしてaをとります。上記の確率質量関数は、「標準化された」形式で定義されています。分布をシフトするには、locパラメータを使用します。具体的には、zipf.pmf（k、a、loc）はzipf.pmf（k-loc、a）と同じです。しかしaとkはに何

1熱

1答えて

gnuplotのデータから "完璧な" Zipf分布をプロットする

私の目標は、単純な.datファイルを作成し、実際のデータと完全なZipf分布の理論上の点、つまり分布をプロットすることです各項目は1 /（ランク）に等しい値を持つ。私はちょうどこのような場合には（ランクごとに理想的なジップ分布値を含む新しい列を追加することができますことを学んだ別のスレッドから # List of most followed users on instagram # By ran