1
this blogでは、Google Cloudの従業員がBigQueryの機械学習用データセットの繰り返しサンプリングを行う方法を説明しています。これは、データの列車/検証/テスト区画の作成(および複製)に非常に重要です。BigQuery Standard SQLで繰り返し可能なサンプリングを行う方法は?
しかし、このブログでは、レガシSQLを使用していますが、Google has now deprecatedでは標準SQLが使用されています。
標準のSQLを使用して、以下に示すブログのサンプリングコードをどのように書き直しますか?
#legacySQL
SELECT
date,
airline,
departure_airport,
departure_schedule,
arrival_airport,
arrival_delay
FROM
[bigquery-samples:airline_ontime_data.flights]
WHERE
ABS(HASH(date)) % 10 < 8
良い質問と回答!私はちょうど1つのことを明確にしたいと思っていました。これは、従来のSQLは非推奨ではないということです。しかし、私たちは標準的なSQLに積極的な開発作業を集中しています。 –