2013-04-22 10 views
5

我々は今、約4ヶ月間にBigQueryを実行していると我々はpricingsに関するいくつかの興味深い観測や質問がある:Bigqueryの価格のバリエーションは?

  1. 価格モデルは、私が参加する実行している場合、それは参加し、労働組合など
  2. のための説明を必要とする非常に原因不明です小さなテーブルでは、私のデータはbigqueryエンジンの内部で乗算された小さなテーブルのコピーごとに増加しますか?
  3. クエリ内で同じサブクエリを再利用すると、これは同じサブクエリであっても新しいデータ処理です​​か?これはどのような方法でも最適化できますか? bigqueryはデータをキャッシュしませんか?
  4. データ処理のために切り上げられる最小サイズはありますか?私たちの観測では4MBだと思いますが、これは正しいですか?
  5. Googleコンソールには地理的な場所に問題があります。私の会社はヨーロッパにあり、そこではすべての開発が行われているため、ほとんどのクエリはCAから行われています。私はすべてのIPアドレスをチェックし、CAのIPはありません。より詳細なレポートを得ることは可能ですか?
  6. 5については、それぞれのクエリの履歴と価格を取得したいと考えています。どうすればこのことができますか?私たちのソフトウェアはこれを行う必要がありますか?
  7. 3)私はこのデータ処理に大きな問題を抱えています(これが私がすべての質問をした理由です)。私の全データセットは約150MBの大きさですが、クエリあたりのDPサイズは3倍になりますか? bigqueryが私の全データを読み込むと、処理されたデータに表示されるサイズに達しません。すべてのケースでデータが再読み込みされ、新しいDPが行われるのはいつですか?そして、これをどのように数えますか?

ありがとうございます。

よろしく、 トミスラフ

+0

これは特に下げられた理由はありますか? –

+0

私はupvotedので0にしています –

答えて

3
  1. 価格は、読まれる必要があるどのようなソースのデータなど、労働組合、参加するために非常に簡単です正確に一度充電されます。たとえば、自己結合を行う場合、データの1回の読み込みに対してのみ料金が発生します。
  2. #1を参照してください。どのようにbigqueryが内部的に働くかにかかわらず、あなたは一度充電する必要があります。
  3. BigQueryは、ベストエフォート型でデータをキャッシュします。クエリを再実行すると、キャッシュがチェックされます。キャッシュにヒットした場合、クエリを再実行しても料金は発生しません。完全なクエリ結果のみがキャッシュされることに注意してください。クエリを変更するかサブクエリで使用すると、キャッシュは使用されません。
  4. BigQueryは1MB単位で切り上げられ、最小サイズは10MBです。
  5. 私はGoogleコンソールのジオロケーションを認識していませんでした。この情報はどこに表示されますか?
  6. jobs.list apiを使用して、クエリの履歴とそれぞれのデータの処理量を取得できます。
  7. 予想よりも大きい実行したクエリのジョブIDを送信できますか。実行される計算は、 8バイト*(整数行と浮動小数点列の読み込み数)+ 2バイト*(読み込まれた文字列列のすべての文字列の合計長さ)です。

これがあなたの質問に答えるかどうか教えてください。

+0

3の答えはあまりにも曖昧です。以前の(キャッシュされた)クエリを新しいものと組み合わせても、キャッシュのコストメリットが得られるのであれば、私たちも興味があります。ただし、古いクエリに新しいサブクエリを追加するとすぐに、キャッシュされていないものとして料金が請求されます。 –

+1

明確化された、私は願っています。 –

+0

私は#4のために追加します - そして最低の請求されたサイズは関係するテーブルあたり10MBです –

0

#5を明確にすることができます。

Google APIコンソールのREPORTSには、プロジェクトのAPIリクエストに関する人口統計情報があります。BigQuery自体やGoogle APIコンソールとはあまり関係がないと思われます。

関連する問題