ケトルPDI：より良い検索と挿入の更新または挿入の更新+参照

別名Pentaho Data Integrationのケトルで、いくつかのカテゴリにリンクされたいくつかの製品でxlsを読んで、それらをdbに挿入します。ケトルPDI：より良い検索と挿入の更新または挿入の更新+参照

リレーションシップカテゴリproductは1：nです（1つのカテゴリにはより多くの製品があり、1つの製品は1つのカテゴリに属します）。カテゴリの挿入をしてから、製品の挿入を行います。

CASE 1：

CASE 2：コードによって

ケース1またはケース2の方が良い（高速/メモリ使用）ですか？

サブカテゴリ、サプライヤーおよびその他の関連エンティティに同じ選択が適用されます。

実際に私はケース1を使用し、pdiは毎秒4レコードを処理し、100kレコードのファイルを持っています。

2番目の方法を使用して製品を読み、製品ごとにLookup steamを使用して製品の1つのカテゴリを見つけることをお勧めします。

そのように進む理由は、人間の考え方です。そしてそれも。 Lookup stream（Lookup Databaseではなく）はかなり最適化されています。場合によっては、データベースの結合よりも早く参加することもできます。

2018-01-03 19:15:23 AlainD

答えて