2017-02-09 12 views
0

reddit comment bigquery 2015で特定のフレーズの出現箇所を検索しようとしています。フレーズはクエリの実行によっても取得されました。bigqueryのアイテムの出現数をカウントするには

SELECT c 
FROM (
SELECT title 
FROM [lucid-bond-156818:bquijob_658cefdf_15a212b8aaf] #the phrases I want to search within reddit comment bigquery 
SELECT COUNT(title) as c in [fh-bigquery:reddit_comments.all_2015] 
) 

私は最後の行で、私は基本的にお伝えしたいと思いますので、私はそれを固定し、トラブルを抱えているSQLで初心者だ:フレーズにアクセスすることができること(列に格納されている)ので、私はテーブルの結果を保存しますredditコメント2015データ内のタイトルを数えるためのクエリ。

答えて

2

を開始するには - このタイトルはに登場したコメントの数と一緒にあなたのタイトルのリストを与える
このクエリの下にしてみてください(私はこれがあなたが求めて何だと思う - 私が正しくあなたを理解している場合)。

上記
#legacySQL 
SELECT title, COUNT(1) AS occurrences 
FROM [fh-bigquery:reddit_comments.2005] AS c 
CROSS JOIN YourTableWithTitles 
WHERE body CONTAINS title 
GROUP BY title 
ORDER BY occurrences DESC 

私は[fh-bigquery:reddit_comments.2005]テーブルの代わりに、[fh-bigquery:reddit_comments.all_2015]ビューを使用しています、あなたがここに見ることができるようにすべてのあなたのタイトルがtitle

YourTableWithTitlesテーブルに格納されていることを前提とし。これは、テスト中にクエリを安価にするためです(2005テーブルは1075行、all_2015ビューは6億6800万行以上に及ぶ)。最終的なバージョンを作成すると、そのビューに戻ることができます。

また、このビューはレガシーSQLで書かれているため、このビューを使用するクエリもレガシーSQLでなければならないので、私もそれに固執します

初心者の方でもそれほど違いはありませんが、ちょっとしたことが分かると、BigQuery Standard SQLをチェックしてください。

+0

どうもありがとうございます!!私はあなたのテーブルのIDテーブルIDテーブルIDを「ジョブID」に挿入しなければなりませんでした – song0089

+0

@ song0089:あなたは本当に答えを受け入れなかった多くの質問があります。たぶんあなたはそれらを通過し、(もちろん彼らが本当にあなたの問題を解決した場合のみ)受け入れられるように最高のものをマークすることができますか? – Cleb

関連する問題