コミュニティのさまざまな人々が、小さなチーム(3-5人)のツール/言語の選択について考えると、簡単なデータ駆動型アプリケーションを開発することができます。我々は、データの分析/分析/ Datavisを実行したい。ウェブベースのデータビジョン/マイニング用の開発スタックの選択
最終的には、データ処理の最終段階で最終的にHadoopを使用し、フロントエンドでjavascriptを使用します。理想的には、あるレベルのR統合も必要です。
現時点では、Rpy(http://rpy.sourceforge.net/)とBoto(http://code.google.com/p/boto/)でRを使用しているDjango、Pythonです。
他にも良い選択肢はありますか?代わりにJVMルートに行くのに重要なダウン/アップサイドはありますか?どのツールを使用しますか、なぜですか?
パイロン/ピラミッドを考えましたか?バックエンドに関する仮定が少なくなります(とりわけ)。私はデータウェアハウスプロジェクトにパイロンを使用しており、すぐにピラミッドに移行することを検討します。 – Marco
こんにちは!データのマイニングと分析では、主な言語は非常に多くの場合Rです。私の目では、主な言語に焦点を当ててデータ分析を行い、それを非常にうまく実行する必要があります。データがそれほど重要ではないと私が推測することを提示するためにどのようなスタックが関与しているか。 Javascriptはajax経由でRest Interfaces(http middlewhere)にアクセスできるため、ほとんどのものが動作します。彼らは高度な機能を持っているが、急な学習曲線を持っているので、私はR、Haskell、Javascriptを使うだろう。 Rは自然言語には適していません。私はHadoopを5テラバイトプラスまたは非常にタイムクリティカルなもの(ミリ秒単位のGB)で使用します。 – mrsteve
多分、どのような分析をしたいのですか、あなたのデータ、あなたのデータ(「時系列」、「テキスト」、「ビジネスデータ」など)約100GB、またはそれ以上) – mrsteve