2017-05-02 9 views
0

このGAの問題は困惑しています。私は、ユーザー識別子、ブラウザのタイムスタンプ、セクション名など、いくつかのカスタムディメンションを持っています。私は、GAからの結果をPythonでv4 APIを使用してダウンロードしています。複数のディメンションのGoogleアナリティクスAPIのダウンロード - ディメンションの増加に伴い数字が減少します

ga:eventCategory、ga:eventAction、ga:eventLabelと一緒にユーザーIDをダウンロードすると、正しいと思われる1日あたり約12K行が取得されます。タイムスタンプを追加すると、予想どおり、数字が約15K行に増加します。

最終的なカスタムディメンションのセクション名を追加すると、の数値がに減少します。おそらく、その次元は常に渡され、定義されます。

これは私には直観的ではありません。バッチクエリに別のディメンションを追加すると、行数が減少するのはなぜですか?

答えて

0

最終的なカスタムディメンションはではなく、が常に定義されています。だから私は、バッチクエリに他のディメンションを追加したときに、ディメンションが定義されていない行が失われました。

これは、Googleアナリティクスのドキュメントに大きな文字で表示する必要があります。ディメンションを定義しないと、そのディメンションをクエリするときにその行が失われます。空の値は決してありません。代わりに、UNDEFINEDのようなものを使用してください。その後、ダウンロードしてそのキーワードを検索することができます。

この問題を見つけるために、最終ディメンションを除いてすべての結果をファイルall_but_section.csvにダウンロードしました。次に、最後の次元のすべての結果をファイルall_with_section.csvにダウンロードします。私はCSVからセクションの列を削除しました。 UNIXの策略のビットでは、これはあなたの寸法が不足している行を示します:

cat all_but_section.csv all_with_section.csv | sort | uniq -u 

を誰かが興味を持っている場合は、私も、私は列を抽出するために構築された小さなPythonスクリプトを提供することができます。

関連する問題