0
私はブタの値の割合を計算するのと同じ仕事をする2つのスクリプトに出くわしました。豚のパフォーマンスを測定する方法
SCRIPT1
total = FOREACH (GROUP A ALL) GENERATE COUNT(A);
rows = FOREACH (GROUP A by $0) GENERATE group as colname, COUNT(A) as cnt;
fractions = FOREACH rows GENERATE colname, cnt/(double)total.$0;
スクリプト2
test = LOAD 'test.txt' USING PigStorage(',') AS (one:chararray,two:int);
B = GROUP test by $0;
C = FOREACH B GENERATE group, COUNT(test.$0);
D = GROUP test ALL;
E = FOREACH D GENERATE group,COUNT(test.$0);
F = CROSS C,E;
G = FOREACH F GENERATE $0,(double)($1*100/$3);
SCRIPT1当初から効率的スクリプト2ということです。
豚スクリプトのパフォーマンスを測定するために、VisualVM、JavaのJProfilerなどのツールがあるかどうかを知りたいと思っています。
スクリプトを実行するのにかかる時間は、対策を行う1つの方法ですが、ツールをビルドするにはそれがありますか?
これを試してみてください:http://stackoverflow.com/questions/19434894/pig-performance-measurement私はjob.Butを行います時間でそれをチェックすることは、私は排他的であるかどうかを知りたいと思ったことを知っている – ANI
パフォーマンスをチェックするツール。 –