私は、(クエリ内で作成された)列「alpha_ssc_key」に基づいてテーブルから重複を除外しようとしています。しかし、このクエリを実行すると、単に "alpha_ssc_key"が重複している行を削除するのではなく、すべての結果が返されます。どんな助けでも大歓迎です!BigQuery内の標準SQLでDISTINCTを使用して重複を削除しました
これはBigQueryで実行されています。
WITH ssc_test_view AS (
SELECT
DISTINCT CONCAT(CAST(date AS STRING), ciq_id, CAST(quantity AS STRING), CAST(cost_basis AS STRING),fund,security,class,inv_type,share_type) AS alpha_ssc_key,
_metadata_created_at AS file_date,
realized_gain_loss,
cusip,
acq_txn_no,
acquisition_date,
security,
company,
ticker,
ciq_id,
class,
inv_type,
dis_txn_no,
quantity,
categorization,
transaction_type,
cost_basis,
share_type,
fund,
net_proceeds,
unit_cost
FROM
`fcm-dw.acquisition_ssc.ssc_log`)
SELECT
*
FROM
ssc_test_view
この場合、min関数とは何ですか?ちょうど最初のインスタンスを取る? –
それぞれのフィールドには最小値が必要です。私が言及したように - あなたは任意の捨て去り論理を使うことができます - しかし、あなたはグループ化リストの外にあるそれらのフィールドのためにただ一つの値を選択する必要があります –
私はMIN()のような集約論理を残すことができました。これらの記録に基づいて雑草を刈り取ったのでしょうか?上記のキーが、このデータセットを重複除外するために使用したいフィールドであるとします。重複除外のためにそのキーで何を使用すべきですか? –