BigQueryテーブル(> 5mil以上)があります。Pythonで大きなBigQueryテーブルからデータを取得する
このデータをバッチで取得し、AppEngine、pythonで処理する必要があります。
私が知っているテーブルからフェッチする唯一の方法は、このテーブルに対してSELECTクエリを実行し、次にトークンfetch_dataが返す結果を反復することです。
それは次のようになります。
query = u"""\
SELECT url FROM %s
""" % (query_table)
query_job = client.run_async_query(str(uuid.uuid4()), query)
query_job.begin()
wait_for_job(query_job, 1)
query_results = query_job.results()
rows, total_rows, next_token = query_results.fetch_data(max_results=per_page, page_token=page_token)
これは、小さなテーブルの上に動作しますが、私のような大規模なもので、それは大きな要求を許可し、ターゲット表を指定することが求められます。しかし、これは私には意味がありません。単にテーブルからデータをフェッチするには、別のテーブルにコピーする必要がありますか?