BigQueryの正規表現

次のデータを持つ表があります。「_」で分割した場合は2番目のフィールドを抽出しようとしており、[numbers-numbers | numbers-numbers]を含める必要があります。 regexp_extractで試しましたが、目的の結果を得ることができませんでした。BigQueryの正規表現

これを達成する方法をお勧めします。

データ：

           output 
D22_022-010|022-009_84233|669250 345  022-010 172.5 
D22_022-010|022-009_666249|843250 22  022-009 172.5 
D28I_28-04_5042|44182_250   235  022-010 11 
D22_022-010|022-009_8423250   232  022-009 11 
D23_23-06_NA_FW27_D23_600   22  28-04 235 
D21_21-08_NA_FW14_D21_50   56  022-010 116 
D23_23-06_NA_FW27_D23_90   88  022-009 116 
D21_21-08_NA_FW14_D21_50   99  23-06 22 
G | TR | Search : 56021    89  21-08 56 
Free Sprayer_1x1(3.30)    77  23-06 88 
Click Tracker (5.4)     33  23-06 99 
6.1 FW18_D28o_Click     4  21-08 89 
              null 77 
              null 33 
              null 4

以下

出典

2017-08-28 KeepLearn

あなたはregexp_extractで何をしたのですか？ –

このクエリは、2番目のフィールドを抽出しようとしましたが、「配列インデックス1が範囲外です（オーバーフロー）」というエラーが発生しました。 AD FROMとしてAD（ "AD |" _ "）[offset（1）]、[[0-9] + - [0-9] + '）を選択します（" G | TR | Search：56021 "AD ） – KeepLearn

その文字列にはアンダースコアがありません。少なくとも2つの要素があれば、オフセット1には何かがあります。 –

はあなたの列がad以下valueはあなたが求めて何をすべきですと仮定すると、BigQueryの標準SQLのため

ある

#standardSQL 
SELECT item, ROUND(IFNULL(value/ARRAY_LENGTH(items), value)) AS split_value 
FROM (
    SELECT value, 
    SPLIT(REGEXP_EXTRACT(ad, '_((?:[0-9]+-[0-9]+)(?:\\|(?:[0-9]+-[0-9]+))*)'),'|') AS items 
    FROM `yourProject.yourDataset.yourTable` 
) LEFT JOIN UNNEST(items) AS item

あなたはあなたの質問からダミーデータの下でこれをテストしてくださいすることができます

#standardSQL 
WITH `yourTable` AS (
    SELECT 'D22_022-010|022-009_84233|669250' AS ad, 345 AS value UNION ALL 
    SELECT 'D22_022-010|022-009_666249|843250', 22 UNION ALL 
    SELECT 'D28I_28-04_5042|44182_250', 235 UNION ALL 
    SELECT 'D22_022-010|022-009_8423250', 232 UNION ALL 
    SELECT 'D23_23-06_NA_FW27_D23_600', 22 UNION ALL 
    SELECT 'D21_21-08_NA_FW14_D21_50', 56 UNION ALL 
    SELECT 'D23_23-06_NA_FW27_D23_90', 88 UNION ALL 
    SELECT 'D21_21-08_NA_FW14_D21_50', 99 UNION ALL 
    SELECT 'G | TR | Search : 56021', 89 UNION ALL 
    SELECT 'Free Sprayer_1x1(3.30)', 77 UNION ALL 
    SELECT 'Click Tracker (5.4)', 33 UNION ALL 
    SELECT '6.1 FW18_D28o_Click', 4 
) 
SELECT item, ROUND(IFNULL(value/ARRAY_LENGTH(items), value)) AS split_value 
FROM (
    SELECT value, 
    SPLIT(REGEXP_EXTRACT(ad, '_((?:[0-9]+-[0-9]+)(?:\\|(?:[0-9]+-[0-9]+))*)'),'|') AS items 
    FROM `yourTable` 
) LEFT JOIN UNNEST(items) AS item

結果は（あなたが期待するよう）

item split_value 
------- ----------- 
022-010  173.0 
022-009  173.0 
022-010  11.0 
022-009  11.0 
28-04   235.0 
022-010  116.0 
022-009  116.0 
23-06   22.0 
21-08   56.0 
23-06   88.0 
21-08   99.0 
null   89.0 
null   77.0 
null   33.0 
null   4.0

出典

2017-09-06 17:52:16

答えて

関連する問題