2016-07-21 6 views
1

Big QueryストリーミングAPIを使用し、各行にinsertIdを設定すると、同じinsertIdの後続の挿入を実行して行を更新(上書き)できます。insertIdを使用して行を上書きするBig Query Streaming API

だけ述べて、この動作は、documentationで言及されていません。

BigQueryはベストエフォートベースでデータを重複除外しinsertIdプロパティを使用しています。

Big Big Queryは常に同じinsertIdを持つ行を上書きしますか?

これはデータの更新に使用できる可能性がありますか?

答えて

1

ドキュメント:これは、ドキュメントで「重複排除」と書かれている(または少なくとも暗示している)ものです。同じinsertIdで送信されたデータが同じであると想定しているため、ただし、これはベストエフォートであり、保証されていないことに注意してください。

上書き:いいえ、いくつかの要因があります。それはベストエフォートだけなので、保持するデータを制御することはできません。また、ストリーミングバッファのデータにのみ適用されます。データがコミットされると、重複排除のメカニズムはもう有効になりません。

+0

なぜ彼らがあなたを落胆させましたが、アップフォートを持っているのか分かりません。それは正しい答えです。 –

+0

ありがとう@FelipeHoffa! – iustin

+0

@FelipeHoffa and iustinこれは、ドキュメンテーションの言い直しとそれ以上の前提を作るもので、何もサポートしていません。 これはわれわれが見つけた振る舞いではないため、別々の要求で同じ行を複数回上書きすることができます。 ストリーミングバッファーの長さはどのくらいですか?これまでのところ、上書きは15分以上正常に実行されています。 –

関連する問題