2017-02-17 7 views

答えて

3

: -

/opt/kylo/kylo-services/bin/run-kylo-spark-shell.sh

した後、「スパーク「サブミット」。

+1

Kylo 0.7.0では、spark-submitは 'local'モードと 'yarn-client'しかサポートしていないと思います。それは間違いなく「糸クラスター」では機能しません。たぶんあなたはこれをあなたの答えに加えることができますか? –

0

私は視覚的な質問スパークジョブを糸クラスタモードで実行しようとしましたが、うまくいくようです。以下は各モードでの私の観察です。

ローカルモード:それはかなりうまくいくが、それはエッジノードからのメモリとコアのためのルックとしてエッジノードに圧力をかける。

ヤーンクライアント:エッジノードの制限を避けるため、ビジュアルクエリを設定して糸クライアントモードを実行します。しかし、ある日、ディスク障害が発生し、ファイルが見つからないという例外が発生したため、視覚的なクエリが失敗しました。驚いたことに、それは別のノード(HDFSレプリケーションの概念)上のファイルの別のコピーを探すことはありませんでした。

yarn-cluster:このモードでは、パフォーマンスが向上し、ファイルが見つからないという例外を回避できました。しかし、私たちが直面した課題は、ビジュアルクエリの設計アプローチによるものでした。視覚的なクエリのためのsparkシェルサーバーを起動すると、スパークコンテキストが作成され、サーバーアプリケーションを起動するまでそのコンテキストが終了しません。これの影響として、糸リソースマネージャのUIには、あなたがアプリケーションを終了させるまでthinkbig sparkサーバーが常に稼動しており、リソースを解放することはありません。

おそらく、私たちはKyloの最もクールな機能の1つとして視覚的なクエリを強化しようとするべきでしょう。

関連する問題