Как реплицировать посещения поля GA в Big Query

В типичном сеансе GA после выбора идентификатора представления и диапазона дат

Мы можем получить данные за неделю следующим образом:

Users
146,207

New Users
124,582

Sessions
186,191

Вопрос в том, какие поля BQ запрашивать, чтобы получить это значение Users?

Вот пример запроса с 2-мя методами (2-й метод закомментирован).

SELECT      
        count(DISTINCT(CONCAT(CAST(visitID as STRING),cast(visitNumber as 
STRING)))) as visitors,   

 --  count(DISTINCT(fullVisitorId)) as visitors

Я заметил, что метод FVID был довольно близок к тому, что я вижу в GA (пользователи немного занижены на 3% в BQ), и если я использую закомментированный метод, я получаю значение, которое завышено примерно на 15% по сравнению с Г.А. Есть ли в BQ более надежный метод для получения значения Users в GA?


person Mark Ginsburg    schedule 13.03.2018    source источник
comment
Вы проверили предыдущие вопросы? Это звучит очень похоже на те, о которых уже спрашивали раньше — взгляните на поиск StackOverflow.   -  person Elliott Brossard    schedule 14.03.2018
comment
Вы можете проверить stackoverflow.com/questions/30419771/ для воссоздания посещений/сеансов. Для посетителей COUNT(DISTINCT fullvisitorid) в стандартном sql является надежным и более точным способом, чем GA, который производит выборку, даже если они говорят, что они нет.   -  person Martin Weitzmann    schedule 15.03.2018


Ответы (1)


Метод COUNT(DISTINCT fullVisitorId) является наиболее правильным, но он не соответствует тому, что сообщает Analytics 360 по умолчанию. С прошлого года в Google Analytics 360 по умолчанию используется другой расчет показателя "Пользователи", чем раньше< /а>. Старый расчет, который все еще используется в отчетах без выборки, с большей вероятностью будет соответствовать тому, что вы получаете от BigQuery. Вы можете убедиться в этом, экспортировав отчет как отчет без выборки или воспользовавшись функциями создания отчетов без выборки в Management API.

Если вы хотите, чтобы числа точно совпадали, вы можете отключить новый расчет, следуя инструкциям здесь< /а>. Точные детали нового расчета не являются общедоступными, поэтому дублировать это значение в BigQuery довольно сложно.

Есть еще несколько причин, по которым вы можете увидеть разные числа, даже при старом расчете. Во-первых, если на сайте реализован идентификатор пользователя, в этом случае Номер GA будет ниже, чем у BigQuery для fullVisitorId. Другой — выборка, хотя это маловероятно в Analytics 360 в тех объемах, о которых вы говорите.

person colintemple    schedule 14.03.2018