スカラから利用できるように、優れた堅牢なMapReduceフレームワークを探したいと思います。ScalaのMapReduce実装
答えて
Hadoopでの回答に追加するには:少なくとも2つのScalaラッパーがあり、Hadoopをより使いやすくすることができます。 Scalaの地図を削減
(SMR):http://scala-blogs.org/2008/09/scalable-language-and-scalable.html
SHadoop:http://jonhnny-weslley.blogspot.com/2008/05/shadoop.html
UPD 10月5日11
また、Scoobiフレームワークもあり、素晴らしい表現力があります。
http://hadoop.apache.org/は言語に依存しません。
scouchdb、CouchDBを使用するScalaインターフェイスに興味があるかもしれません。
もう1つのアイデアはGridGainです。 ScalaDudesには、ScalaでGridGainを使用する例があります。もう一つの例はhereです。
私はまさにこの問題に遭遇し、ScalaからHadoopを使いやすくするための小さなインフラストラクチャを作成しました。私はしばらくそれを使っていましたが、ついにそれをウェブ上に置くことになりました。それは(非常に元々)ScalaHadoopという名前です。
to jshen's point:
hadoopストリーミングは単にソケットを使用します。 Unixストリームを使用すると、コード(任意の言語)はstdinから読み込み、タブで区切られたストリームを出力するだけで済みます。マッパーを実装し、必要に応じてレデューサー(必要に応じてコンバイナーとして設定)を実行します。
hadoopの上にあるscala APIについては、Scoobiをチェックアウトしていますが、まだまだ開発が進んでいますが、多くの約束事を示しています。 Scala incubatorのhadoopの上に分散コレクションを実装する努力もありますが、その努力はまだ使えません。
Scaldingと呼ばれるTwitterからカスケードするための新しいスケーララッパーもあります。 Scaldingのドキュメントを非常に簡単に見てみると、 のように、カスケードとの統合がスムーズになりますが、まだ はカスケードの主な問題を解決できません。 カスケードの各演算は、カスケードのタプル(基本的に のフィールド値のリストであり、別個のスキーマの有無にかかわらず)で動作します。つまり、 型のエラーです。キーを文字列とキーとしてLongに結合すると、実行時にエラーが発生します( )。
スケーリングにはタイプセーフなAPIがあります:https://github.com/twitter/scalding/wiki/Type-safe-api-referenceとFields API文字列をlongに結合しても実行時例外は発生しません(両方が数字の場合)。もちろん、型セーフなAPIでは、このような結合はコンパイラによって禁止されています。 –
個人的に、私は、Sparkの大ファンになった
あなたはかなりあなたはディスクを集中MapReduceの操作から経験するオーバーヘッドを削減する、メモリ内のクラスタコンピューティングを行う能力を持っています。
- 1. ニューラルネットワークの実装MapReduceスタイル
- 2. Hadoop MapReduce、Java実装の質問
- 3. 実装(Scalaでプログラミング)
- 4. Scalaのトレイトを実装
- 5. Scala OnCreate代替実装
- 6. ScalaでのカスタムSortedMapの実装
- 7. OCaml、Scala、Goの構造型の実装
- 8. ScalaのPlayでHibernateを実装する
- 9. ScalaでExpandoObjectを実装する
- 10. Scala Breezeでelementwise UFuncを実装する
- 11. Play Framework 2.5.x Scala Slick実装スタイル
- 12. のHadoopのMapReduceは、今私はのHadoopのMapReduceジョブを実行
- 13. Scalaのリストのパーティションメソッドのテール再帰的実装
- 14. Scala - Traitの実装のためのパッケージ/フォルダをスキャンする
- 15. MapReduceフレームワークはどのようにソート段階を実装していますか?
- 16. Scalaでのファクトリの実装を簡潔に行う方法
- 17. Scalaの配列を使用したキュー実装のエンキューメソッド
- 18. Scala:単純なカスタムタイプのmapとwithFilterの実装
- 19. Scala - ポリモーフィズムのない多形抽象的特徴の実装
- 20. Scalaのstring.replaceAllのチェーンを実装する方法
- 21. Java/Scalaインメモリ統計データベースの実装方法は?
- 22. Scala:一般的な折り畳みの実装
- 23. データフレームを使用したマージの実装(Scala/Spark)
- 24. ScalaでAkkaのないActorモデルを実装する
- 25. Scalaは:私は、このソリューション実装した
- 26. Scala + Hibernateで1対多の関係を実装する
- 27. Scalaのジェネリックス:インターフェイス/特性を2回実装する?
- 28. PLINQを使用してC#でMapReduceを実装する方法は?
- 29. Scala - コンパニオンオブジェクトに "manager"パターンを実装していますか?
- 30. Scalaで幅広いファーストサーチを実装する方法
SHadoopはかなり古いです - 古いMRフレームワークを使用しています。私はいくつかの点で暗黙を更新しました:https://github.com/schmmd/Hadoop-Scala-Commons – schmmd
スケーリングもオプションです。 https://github.com/twitter/scalding –