Google Big Queryにインポートするテーブルがあります。 これらの表は私のステージング表です。ビューを使用してステージング表を論理ウェアハウス表に変換しています。 私の問題はサロゲートキーです。Google BigクエリにFarm_fingerprintを使用する
現在、データが大きすぎるため、ROW_NUMBER()が失敗しています。
私はFARM_FINGERPRINT
ビッグクエリでSurrogate_key世代を採用する適切な方法がありますを使用することを推奨されていますか?説明を明確にするために、更新1。
ありがとう
私のソーステーブルの中には、数百万のレコードを持つ30のフィールドがあります。ここに表示するには大きな。後でBIツールを支援する代理キーを作成する必要があるため、これらのレコードをテーブルに変換しています。
この目的のために、私たちのビュー(ターゲットテーブルを置き換える)には変換があり、ROW_NUMBER()関数を使って独自の代理キーを作成していました。この関数はBig Queryにロジック全体を1つのノードにプッシュさせ、クエリをクラッシュさせることを認識しました。
代理キーとして使用するINT64値を取得するための入力として一意のビジネスキーを表す連結フィールドの文字列を使用してFARM_FINGERPRINT()を使用しています。これは、チームによって必要に応じてBIツールで使用できる整数を提供するということです。
大規模なデータセットがある場合、Google Big Queryで整数ベースのサロゲートキーを生成する適切な方法がありますか?
ありがとうございました。
:今、各行は
first_letter_author
+row_number
で構成されるIDを持つことができます。今はあまりにも一般的です! –明確にする - ユニークなキーを使用してテーブルの横に列を表示する予定ですか?あなたのテーブルのスキーマは何ですか? –