誰かがTezでSpark/Flinkを実行するのはなぜですか？。

サハらから Tez paperにおいて

は、TEZとHadoopの2次のモジュラーアーキテクチャが示されている：誰かがTezでSpark/Flinkを実行するのはなぜですか？。

Hadoop 2 with Tez

なぜ誰かがTEZにスパーク/ FLINKを実行しますか？

利点は何ですか？ YARNの使用効率を改善しますか？

出典

2016-09-09 j9dy

著者に直接お問い合わせしてみましたか？ –

私が正しく理解すれば、tezのスパークを実行すると、理論的にはより良いDAGが得られるはずです。例えば機械学習の反復に適用することができる。

関連する段落を以下に示します。

我々はTEZ DAGにコンパイル後のスパーク DAGをエンコードし、スパークエンジンサービスを実行していませんでしたYARNクラスタで正常にそれを実行することができました。ユーザー定義のスパークコードはで、Tezプロセッサのペイロードにシリアル化され、ユーザーコードをデシリアライズして実行する汎用の Sparkプロセッサに注入されます。このはSparkの独自のランタイムオペレータを使用して修正されていないSparkプログラムをYARN上で実行できるようにします... Tezセッションでは、スパークマシンの効率的な実行が可能です。この作品は言われているという実験試作品ではなくの一部スパークプロジェクト

あり、この組み合わせは実験設定外部に実装されていないことが表示されますので、ツールでTEZを組み合わせるためのまともな理由がある場合でも、 Sparkのように、この時点ではどのプロジェクトにも役立たないでしょう。

また、非常に具体的な作業負荷がなければ、Tez DAGが正常なSpark DAGよりも大幅に優れていると私は驚くでしょう。

出典

2017-08-08 11:18:23

誰かがTezでSpark/Flinkを実行するのはなぜですか？ 。

答えて

関連する問題

誰かがTezでSpark/Flinkを実行するのはなぜですか？。