"他の行のデータからグループ化"アルゴリズムのテストデータを生成する方法

更新日：私のアルゴリズム（またはそのような任意のアルゴリズム）のすべてのエッジケースのデータを計算する手法を探しています。
私はこれまでに試したことがありますちょうどエッジケース+いくつかの "ランダム"データを生成するかもしれないことについて考えているが、私は本当のユーザーができることを何か"他の行のデータからグループ化"アルゴリズムのテストデータを生成する方法

タスクは、以下のとおりです。私は私は私のアルゴリズムで重要な何かを見逃していなかったと私はすべての可能な状況をカバーするためにテストデータを生成する方法がわからない確認したい。..

をめちゃくちゃEvent_Dateのデータのスナップショットを報告しますが、に属する可能性のある編集のために別の行を作成します。Event_Date - 入力と出力データイラスト上でグループ2）を参照してください：私のアルゴリズム

input and output data illustration

：

event_dateのリストを作り、彼らのためにnext_event_date秒
を計算結果をmain_audit_tableに合算し、各スナップショット（私のillustraのグループ1〜4）について最大でtransaction_idを計算してくださいン） - event_date、idによってgrouppedとtransaction_date < next_event_dateが真であるかどうか
かどうかに基づいて、2つのオプションによって、結果にcosts_audit_tableに参加する同じtransaction_id
から他のデータを取得するために、結果にmain_audit_tableに参加 - 最大transaction_idを使用

マイ質問（複数可）transaction_idよりも小さくなっています

どのようにすべての可能なシナリオをカバーするテストデータを生成することができますので、私はアルゴリズムの権利を知っていますか？

アルゴリズムロジックに間違いがありますか？

この種の質問にはより良いフォーラムがありますか？

マイコード（テストする必要があります）：

select 
    snapshots.id, 
    snapshots.event_date, 
    main.event, 
    main.transaction_date as last_change, 
    costs.costs as costs_2012 
    from (
    --snapshots that return correct transaction ids grouped by event_date 
    select 
     main_grp.id, 
     main_grp.event_date, 
     max(main_grp.transaction_id) main_transaction_id, 
     max(costs_grp.transaction_id) costs_transaction_id 
    from main_audit_table main_grp 
    join (
     --list of all event_dates and their next_event_dates 
     select 
     id, 
     event_date, 
     coalesce(lead(event_date) over (partition by id order by event_date), 
       '1.1.2099') next_event_date 
     from main_audit_table 
     group by main_grp.id, main_grp.event_date 
    ) list on list.id = main_grp.id and list.event_date = main_grp.event_date 
    left join costs_audit_table costs_grp 
     on costs_grp.id = main_grp.id and 
     costs_grp.year = 2012 and 
     costs_grp.transaction_id <= main_grp.transaction_id 
    group by 
     main_grp.id, 
     main_grp.event_date, 
     case when main_grp.transaction_date < list.next_event_date 
      then 1 
      else 0 end 
) snapshots 
    join main_audit_table main 
    on main.id = snapshots.id and 
     main.transaction_id = snapshots.main_transaction_id 
    left join costs_audit_table costs 
    on costs.id = snapshots.id and 
     costs.transaction_id = snapshots.costs_transaction_id

出典

2012-04-24 Aprillion

このデータがどのようにモデル化され、どのようにこれらのグループを割り当てられたかを明確にすることはできますか？ – Kodra

@Kodraはモデルとして - IBM Tivoli Service Request Manager *監査テーブル（カスタムフィールドが数多くあるa_workorder）+カスタム監査テーブル - 最新のドキュメントやリバースエンジニアリングスキルはあなたのものと同じくらい良いものです。。 – Aprillion

@Kodraグループ割り当ては私のアルゴリズムのポイント2から明らかにする必要があります - そうでない場合は正確には何かを教えてください。私はそれを言い換えることができます、ありがとう – Aprillion

共通テーブル式（CTE）をするだけでなく複雑さを埋めると長いSQLスニペットの重複を減らすための良い方法ですが、あたかも永久的なテーブルから来たかのようにテストデータを表現する簡単な方法です。最低限、CTEはクエリの主要コンポーネントを最上位に集中させ、残りのステートメントでラベルを参照できるようにします。 Graeme BirchallのDB2 SQL Cookbook（よく管理された無料の電子書籍）には、これと他の高度なSQLパターンの良い例がいくつかあります。 Joe Celkoは、SQLをより重いものにするためのアイデアのもう一つの優れた情報源です。

出典

2012-04-25 20:51:21

+1すばらしいヒントですが、実際にはデータの挿入に問題はありません実テーブル - テストする必要のあるエッジケースをどのように計算できますか？（私はランダムなデータをたくさん生成することができ、実際のユーザーが作成するケースを逃すことができます）あなたはこれに関する技術を知っていますか？ – Aprillion

"他の行のデータからグループ化"アルゴリズムのテストデータを生成する方法

答えて

関連する問題