2012-04-14 9 views
6

アイドル状態のHadoopクラスタをオフィスデスクトップにセットアップするプロジェクトがありますか?オフィスコンピュータ上でHadoopソフトウェアを実行中(アイドル時)

私はHadoop/MR/hbaseを試してみたいが、5-10台のコンピュータにはアクセスしていない。作業中のコンピュータは数時間後にアイドル状態にあり、非常に高速な接続によって互いに接続されています。さらに、これらのコンピュータ上のデータは私たちのネットワーク内にとどまるので、プライバシーの問題はありません。

これを動作させるには、各マシンでかなり軽量のモニターが必要です。コンピュータがX時間アイドル状態になると、クラスタに参加します。ユーザーがログオンすると、クラスタから脱落してすべてのCPU /メモリーを戻す必要があります。

このようなことはありますか?

+0

を見てみたいことがあります地図を縮小する。かなり強力なHadoopクラスタを素早く設定できます。 – Suman

答えて

3

タスクスケジューラを使用して、アイドル状態を検出し、仮想ボックスまたはvmplayerでハープープVMを開始/停止することができます。または、リソースの使用状況に基づいて停止を開始するpowershellスクリプトを記述することもできます。

+0

うわー、私は、Windowsスケジューラがアイドルタイムに関してスケジュールを立てることができるとは思っていませんでした!他の人には、次のような便利な機能があります。http://www.microsoft.com/resources/documentation/windows/xp/all/proddocs/en-us/agent_idle_time.mspx?mfr=true – Shahbaz

+0

4ギガのRAMを搭載し、Hadoop Clusterをセットアップしている各デスクトップで仮想ボックスを確立して使用します。それは良い実験室になるだろう。どのような考えやアイデアですか? –

1

Hadoopは計算グリッドではなく、より多くのデータグリッドです(this presentationのスライド9を参照)。重要なのは、データがクラスタ全体に広がっているため、データをコンピュータに保存する必要があるということです。データをコピーしてアイドル状態でないときに削除するのにかかる時間はおそらくそれほど価値がないでしょう - アウダスをクラウド(アマゾン、アズールなど)で使用する方が良いでしょう。

+0

私はデータを削除しません。人間がコンピュータを使用しているときにノードをシャットダウンするということは、ハープ・クラスタからノードを一時的に削除することを意味します。コンピュータがhadoopで利用可能になると、ノードが起動してクラスタに再結合します。 – Shahbaz

0

私はコンドルのようなものを使用したJava

で良いMPCソリューション
+0

Grooveekに感謝します。私はすでに大学で同様のソリューションを持っています(greedy.epfl.ch)。私が探しているのは、Hadoopの実装です。 – Renaud

1

あるNEREUSのようなソリューション:http://research.cs.wisc.edu/condor/

+0

ありがとうHaloWebMaster。私はすでに私の大学でCondorのソリューションを持っています(greedy.epfl.ch)。素晴らしいですが、私はHDFSのようなものを使用したいので、探しているのはHadoop実装です。 – Renaud

+0

Condorのジョブで[Parrot virtual file system](http://ccl.cse.nd.edu/software/parrot/)を使用することができます。 – mhucka

1

あなたは私は非常にアマゾンAWS /弾性をお勧めしますバージニア工科大学のプロジェクト・ムーンhttp://www.wired.com/wiredenterprise/2012/05/project_moon/

+0

彼らのシステムはVirginia Techの外で利用できますか?私はそれをダウンロードするためのリンクを見つけることができませんでした... – Renaud

+0

Renaud、あなたはプロジェクトムーン呉春春http://people.cs.vt.edu/~feng/のリードPIに連絡して、ダウンロードのために – fjxx

関連する問題