私はBigQueryのでクエリをやってる:BigQueryのGROUP BY機能はまだ重複を示す
SELECT id FROM [table] WHERE city = 'New York City' GROUP BY id
奇妙な部分は、それが右隣同士に、多くの場合、重複したIDを示しています。 ID間には何も違いはありません。約500万のIDに対して合計300万行があります。だから多くの重複がありますが、それは設計によるものです。私たちは、フィルタリングによって、それだけではなく、気づいた合計の不一致が簡単に解消されると考えました。
BigQueryのGROUP BY
機能が不適切に機能する理由はありますか?その価値については、データセットには約300万行があります。重複したIDの
例:
56abdb5b9a75d90003001df6
56abdb5b9a75d90003001df6
非印刷可能など、他の文字(複数可)することができますが、コピーすることができますここにいくつかのIDを貼り付けますか? – jperelli
56abdb5b9a75d90003001df6 –
idという名前の列があり、その中に300万行がありますが、select文の唯一の列でグループ化すると重複がありますか?それは合わない。ここには何か他のことがあります。 idのデータ型は何ですか?これは別のクエリの一部ですか? –