2017-02-23 24 views
0

私はmatplotlibからbokehに移動しようとしています。しかし、私はいくつかの面倒な機能を見つける。最後に遭遇したのは、約1.5Mのエントリのヒストグラムを作成するのに数分かかったということでした.Matplotlibでは数分の1秒しかかかりませんでした。それは普通ですか?もしそうなら、理由は何ですか?Bokehチャートのヒストグラムには時間がかかります

from bokeh.charts import Histogram, output_file, show 
import pandas as pd 
output_notebook() 
jd1 = pd.read_csv("somefile.csv") 
p = Histogram(jd1['QTY'], bins=50) 
show(p) 

答えて

2

私はあなたのケースでHistogramで起こっているかもしれないぶっきらぼうかわからないんだけど。データファイルがなければ、試したり再生したりデバッグすることは不可能です。しかし、いずれにしてもbokeh.chartsには現時点でメンテナがないので、実際にはを使用して履歴データを作成することをお勧めします。 bokeh.plotting APIは安定しており(数年前から)、広範に文書化されています。これは、さらにいくつかのコードの行数が、多くはないのです。あなたはそれは、合成データとを生成するなど、千万ポイントヒストグラムのために〜(私のラップトップ上で)半秒を要し見ることができるように

import numpy as np 
from bokeh.plotting import figure, show, output_notebook 

output_notebook() 

# synthesize example data 
measured = np.random.normal(0, 0.5, 1000) 

hist, edges = np.histogram(measured, density=True, bins=50) 

p = figure(title="Normal Distribution (μ=0, σ=0.5)") 
p.quad(top=hist, bottom=0, left=edges[:-1], right=edges[1:], line_color=None) 

show(p) 

enter image description here

それをビニングする。

+0

残念ながら元のデータセットを共有することはできません。私のリテラルクエストには答えることはできませんが、ここでは根本的なものに答えています:プロットAPIでヒストグラムを持つための回避策は何ですか?私はその質問を言い換えるつもりです。どうもありがとう! - 私はこれを数時間前に知っていればいいと思う:( – famargar

関連する問題