apache-apex

    4

    1答えて

    両方ともイベントを一度に処理するストリーミングフレームワークなので、これら2つのテクノロジ/ストリーミングフレームワークのコアアーキテクチャの違いは何ですか? さらに、あるものが他のものよりも適切な場合はいくつかありますか?

    1

    1答えて

    スタートアッププロジェクトの作成に役立つApache Apexに関するドキュメントに従っています。 https://apex.apache.org/docs/apex-3.4/apex_development_setup/#creating-new-apex-project のmavenコマンドの実行時に 、 @echo off @rem Script for creating a new ap

    3

    2答えて

    Apache Apexの2つの異なる演算子間のN/W遅延を予測する方法がありますか? オペレータで使用される予定のデータは、別のマシン上に存在します。これはオペレータの待ち時間に追加されます。 これはどのようにして計算できますか?

    2

    1答えて

    実行中のApexアプリケーションで異なるソースの入力演算子を追加することはできますか? 例:プロダクション環境では、Apexアプリケーションを実行して入力ソースからテキストファイルを読み込み、その入力演算子を含むカフカソースを同じDAGに追加します。

    3

    2答えて

    apacheの頂点を起動することができません。 文書は、ちょうどコマンドプロンプトでapexを入力しますと言うが、それはNo command 'apex' found が、私はそれを使用して開始する前に実行する必要があり、いくつかの事前の手順はありますか?と言いますか 私のような利用可能なすべての前提条件、Hadoopの、JDK 7、GitリポジトリとMavenを持っています。

    2

    3答えて

    Apexのすべての例では、DAGの最初の演算子は入力演算子である必要があります。このオペレータは、どこかのDAGの中央に表示できますか? 前の演算子によって処理されたばかりのデータに基づいて、データベースからデータをフェッチする場合を考えてみましょう。これは、入力演算子がどこかのDAGの中央に来ることを意味します。 入力演算子の定義によれば、入力ストリームを持たない演算子です。しかし、コネクタが使

    2

    2答えて

    Apache Apex 3.5.0をMalhar 3.5.0とともにダウンロードしました。 私は正常に頂点クライアントを開始し、(CDH 5.10を実行している)私たちのYARNクラスタにヤフー・ファイナンスのデモ例を提出しました。クラスタが実行され、正しく構成されています(多くのSparkおよびMRジョブが実行されています)。 私はYARNならびにアペックスCLIでRUNNINGとして提出された

    2

    2答えて

    Apache Apexでバッチ処理アプリケーションを作成するにはどうすればよいですか? 私が見つけたすべての例はストリーミングアプリケーションでした。つまり、終了していないことを意味し、すべてのデータを処理してからアプリを終了したいと考えています。 ありがとうございました

    1

    3答えて

    複数のオンプレミスデータベースの顧客データをクラウドに同期する必要があります。第2のステップでは、(異なるタイプの)重複を除去するために、そこにある顧客データが何らかのクリーンアップを必要とする。その清潔なデータに基づいて私はいくつかのデータ分析を行う必要があります。 この目標を達成するために、私が使用できるオープンソースのフレームワークまたはクラウドソリューションを探しています。私はApache