私はそれをロードするために私が火を使用した〜7400000行を持っているデータテーブルがあります。Blazeパッケージで特定の行を効率的に見つける方法はありますか?
from blaze import CSV, data
csv = CSV('train.csv')
t = data(csv)
これはフィールドこれらを持っている:これは、このような大きいデータフレーム、特定の基準に適合するどうすれば効率的に出力列であるので、A、B、C、D、E、F、G
か?たとえば、A == 4、B == 8、E == 10の行が必要です。ルックアップをマルチタスクする方法はありますか?たとえば、スレッディングや並列プログラミングなどでは?
たとえば、あるスレッドが行1から行100000までの一致する行を見つけようとし、2番目のスレッドが行100001から200000まで一致する行を見つけようとします。 。
あなたがhttp://stackoverflow.com/questions/27505764/pydata-blaze-does見てきました-it-allow-parallel-processing-or-not私は火災を知らないが、ここの答えはあなたが望む方向を指しているようだ – saulspatz