2012-11-26 17 views
8

データセットの統計を計算する必要があるWebアプリケーションを構築しています。パーセンタイル、平均、モード、およびその他の統計関数を配列で計算する必要があります。配列の統計を計算する

通常はPythonで、私はstat配列関数の巨大なライブラリを持つscipy、numpy、またはnltkを使用します。これを行うために利用できるルビーの宝石や図書館はありますか?

既存のライブラリがない場合、私のアプリケーションをRuby/Railsに入れたまま、Pythonでデータ処理を行う簡単な方法はありますか?

+0

実際にはまだ統計にはあまりサポートはしていませんが、[Sciruby](http://sciruby.com)があります。今はあまり活発ではありません。私はルビーがまだ計算には遅すぎると思う。 – halfelf

答えて

7

本当に完全統計ライブラリが必要な場合は、statsampleをご覧ください。それ以外の場合は、descriptive_statisticsが素晴らしい軽量の代替であることがあります。

+0

AR内の文字列を列挙するEnumerable(レール版をオーバーライド)の合計を定義するように見えるため、descriptive_statisticsの使用は難しいです。 – slykat

+0

心配しないで、私はそれが 'descriptive_statistics/safe' – slykat

1

RubystatsまたはEasystatsを使用することができます。そこには私が知らない宝石がたくさんあると確信しています。

0

numbercrunchingの場合は、Narrayが標準推奨です。統計的方法は、総和、累積合計、積(掛け算要素)、累積生産、平均、標準偏差、ルート平均平方根、ルート平均平方偏差、最小値、最大値、および中央値です。

数値に特化しているため、最大50倍高速でメモリ効率の良いtham Arrayになるのはclaimedです。

0

ActiveRecordモデルの統計情報を計算する場合は、おそらくstatistics gemをチェックアウトすることをお勧めします。

私はまた、GNU-R統合を提供するstatisticusとコンソールに使用するためのSIRBをブックマークしました。

PythonをRailsアプリケーションで実行する方法はたくさんありますが、Rubyライブラリで必要なメソッドを見つける方が簡単でしょう。

0

JRubyで統計を行う新しいGem - MDArrayを実装しました。 JRubyは基本的にJavaなので、これは実際にはWebアプリケーションにとってはかなり良いかもしれません。 MDArrayはNArrayとNumpyの哲学に従っています。この時点ではおそらく両方より遅いでしょう。純粋なRubyの代替よりも速くなければなりません。

あなたが何か助けが必要な場合は、私は試してみてうれしく思います。

乾杯、

ロドリゴ

0

あなたは一定の開発でnumpyのに似て数値計算ライブラリであるNMatrixを、使用することができます。 (免責事項:私はSciRuby/NMatrixチームから来ています)

関連する問題