pentaho-data-integration

    0

    1答えて

    「CSVファイル入力」ステップを使用してPentaho DI変換にもたらされる2つのデータセット(csvファイル)があります。ファイルAには列joincolがあり、値はファイルBの列joincolに表示されます。ファイルAのデータとファイルBのデータを条件A.joincol = B.joincolに結合して、ファイルwantcolの対応するデータをファイルBから取得します。 かなり簡単なものです。

    0

    1答えて

    私はJavaアプリケーションから実行するmongoDBOutputで変換を作成しました。ここで説明するようにKETTLE_PLUGIN_BASE_FOLDERSを追加するためにkettle.propertiesを編集しましたJava Pentaho Exception MongoDB。これは私のWindowsマシンで正常に動作します。しかし、Linux環境上でそれを実行すると問題が発生し、これは私

    0

    1答えて

    ケトル(Pentaho Data Integration)のトランスポータで複数のDB接続があります。 いくつかのルックアップステップとテーブル出力ステップがあります。 同じDB接続を使用する必要があります。 私はステップでDB接続を変更し、他のステップでも自動的に接続を変更する方法を探しています。 可能ですか? 私は接続定義内のパラメータから読み込まれた変数を使用することができますが、私はある種

    0

    1答えて

    私は毎晩パラメタの特定の値で実行される変換を持っています。 パラメータの値がログに書き込まれるようにログを設定することはできますか? 私は、さまざまなサイクルで実行されている約100の変換と「変数の取得」や「ユーザー定義のJavaクラス」やDIYプラグなどの回避策を簡単に追加したり、自動化する必要があります。未来。

    0

    2答えて

    私は実際にPDIに新しいので、CSVからいくつかの抽出を行う必要がありますが、フィールド名が小文字または大文字になることもあります。 私は行のためのそれを修正する方法を知っていますが、フィールド名のためにそれを行う方法を知らない。 これを行う手順はありますか? は、私はあなたがすることができ、列名を変更したい場合は、事前

    0

    2答えて

    10個のサブジョブと変換を含むPentahoジョブのログを格納しようとしています。私は設定に入り、それらをテキストファイルに書き込むことによって、私が各仕事と変容のために個別に行うことができることを知っています。しかし、私は各サブジョブのためにあまりにも多くのファイルを必要としません。すべてのサブジョブと変換をキャプチャする単一のメインジョブのログを保存できる方法はありますか? ありがとうございま

    0

    1答えて

    ペンタホを初めて使っています。基本的に私は、階層構造のデータを必要とします。ここでは、階層のサブセットを選択し、下位レベルのノードでカウント/サムを計算し、レベルごとにレベルを上げる必要があります。 SQLで一時変数に更新を行った後、テーブル変数(ここでの主なポイントは、私がデータテーブルにすべての更新をしないメモリでこれを行う必要があり、ということです。) DECLARE @Consolidat

    0

    1答えて

    私はPentahoのデータ統合から始め、UIから変換/ジョブを作成し、UIやPentaho DI java SDKから実行することができました。また、私はcarte serverをセットアップし、変換を提出し、carte webUIでステータスを監視しました。 私の質問はです: アラカルトサーバーは、私は/変換ジョブを送信し、その進捗状況を監視することができ、その上の任意のJSON/XMLの残りの

    0

    1答えて

    私はget file namesステップを持っていて、4つのcsvファイルを取得する正規表現を持っています。 その後、私はtext file inputステップを持って、csvのフィールドを設定し、これらのファイルを読み込みます。 このステップが完了すると、Table outputステップが実行されます。 問題は、text file inputが1つのステートメント内の4つのファイルすべてを読み取