2016-11-14 20 views
0

テラデータ内のSAMPLEは一様な確率で選択されます(つまり、すべての行に同じ確率を選択すること)。例:teradataユニフォームのサンプルコマンド

select * from employee_table sample 8; 

また、返されたデータは、各実行後に異なることが保証されます

答えて

2

SAMPLEはランダムですが、デフォルトではない本当の簡単なサンプルを使用して。すべてのAMPは、どのAMPによって返される行数を決定するために通信します。つまり、デフォルトのSAMPLEは、1つのAMPにつき1つの別個のサンプルn個のUNIONです。データがハッシュ配信されているため気付きにくいですが、NUPIを使用した斜めの表では、一部の行がサンプリングされる確率が高くなる可能性があります。

真のランダムサンプルが必要な場合は、SAMPLE RANDOMIZED ALLOCATIONオプションを使用する必要があります。すべてのAMPのすべての行が同じ確率で表示されるようになりました。

しかし、ランダムなので、もちろん、各サンプル内に異なる行があることは保証されていません。