чт, 1 серпня 2024 р.
Минулого тижня команда Google BigQuery викатила цікаве оновлення під назвою Table Explorer, яке повинно допомогти аналітикам, та всім іншим хто працює з BigQuery, закривати свої задачі зручніше та простіше.
Якщо дуже коротко, цей функціонал дозволяє вам зручним візуальним способом швидко ознайомитись з даними в таблиці та навіть написати прості SQL-запити.
Хоча функціонал на цей момент дуже простий, нагадаю, він поки в прев’ю. Я думаю, що цей інструмент змінює правила гри і значно спрощує вхід до BigQuery для нетехнічних спеціалістів: маркетологів, ppc-спеціалістів, seo-шників тощо. І нижче я спробую пояснити чому.
Але як завжди, про все послідовно:
Перш ніж продовжимо, під ознайомленням з даними з допомогою Table Explorer, я маю на увазі можливість побачити найпопулярніші значення зі стовпчика та їх кількість, відсортовані від більшого до меншого.
Тобто фактично BigQuery напише за вас ось такий запит (не знаю для чого там DISTINCT при використанні GROUP BY, але все ж нагадую, що функціонал в Preview):
SELECT DISTINCT(`event_name`), COUNT(*) FROM
`learning-platform-370121.analytics_399190266.events_20240731` GROUP BY 1 ORDER BY 2
DESC LIMIT 10
І віддасть вам ось такий результат:
2. Там на нас чекатиме пустий екран і єдина кнопка Select Fields. Натискаємо на неї.
3. В попапі праворуч вибираємо потрібні нам колонки, я для прикладу обрав event_name
і натискаємо знизу Save.
4. І все, ми вже бачимо результат:
Тобто за декілька секунд, без знань SQL, ми отримали відповідь на питання: “Які найпопулярніші івенти за певну дату”.
Хтось може подумати, що на прикладі вище все й закінчується, оскільки зараз ми можемо рахувати тільки кількість рядків. Але ж навіть з таким обмеженим функціоналом можна зробити багато цікавого, особливо, якщо знаєш, що з отриманими даними можна продовжувати працювати, наприклад, використовуючи фільтрацію.
5. Давайте додамо до наших даних інформацію по каналу трафіку та категорії девайсу. Для цього знову натисніть Select Fields, відмітьте значення device.category
, session_traffic_source_last_click.manual_campaign.medium
і натисніть Save.
6. Тепер, коли ми бачимо кількість івентів в розрізі категорії пристрою та каналу трафіку, давайте застосуємо фільтр по івенту session_start
. Для цього відмітьте потрібний івент та натисніть на кнопку Apply.
Якщо ви були уважні, то помітите, що ваші дані по кількості івентів в розрізі категорії девайсів та каналів трафіку змінились (можете порівняти попередній скрін із тим, що нижче). Це тому, що до них застосований фільтр за назвою івенту.
Отже, ми з вами отримали інформацію про кількість сесій за обраний день в розрізі категорій пристроїв та каналів трафіку без самостійного написання SQL коду. Круто ж!
Для тих, хто знайомий з SQL, ви також можете помітити, що система дописала фільтр за нас.
Зверніть увагу, як і завжди в BigQuery обробка даних є платною операцією, тому система покаже вам скільки даних буде оброблено.
І хоча дійсно, поки функціонал досить обмежений, але є й інші способи його використання.
Ось ще один, досить популярний приклад - швидко перевіримо, чи немає в нас на проєкті дублів транзакцій.
ecommerce.transaction_id
і натисніть Save.2. Подивіться на ваші дані. На скріні нижче ви можете помітити, що один ID транзакції повторюється три рази - ось і дублі.
3. Ми можемо навіть піти далі і дізнатись, чи їх зробив один юзер або декілька. Для цього спочатку додайте в Select Fields user_pseudo_id,
а потім відмітьте потрібну транзакцію і натисніть Apply.
А ось і результат - ми бачимо що це 3 різні юзери і біжимо вітати з цим розробника, який скоріш за все допустив помилку при передачі даних до dataLayer
.
Звісно, краще детальніше дослідити наші дані, щоб прийти до розробника з конкретикою. Наприклад, я ще додав до наших даних device.category
і побачив, що ця “одна” транзакція відбувалась навіть на різних категоріях пристроїв, що скоріш за все свідчить про те, що користувач декілька разів відвідував сторінку подяки з різних девайсів, а розробник такий кейс не опрацював.
Як ви бачите, навіть з таким обмеженим функціоналом вже можна зробити багато чого, і все це без написання SQL. Узагалі все це можна зробити зовсім не знаючи SQL.
Звісно, якщо цю статтю читають ті, хто добре знає SQL, вам може здатись, що пропоновані мною приклади досить прості, а функціонал Table Explorer поки що - “ні про що”. Проте зверніть увагу на інше: цей функціонал все ще в попередньому перегляді, і це тільки питання часу, коли можна буде з його допомогою вирішувати складніші завдання. При цьому Google дає нам ясно зрозуміти, що він буде йти шляхом спрощення початку роботи для звичайного користувача, щоб залучати до BigQuery нову авдиторію активніше, в тому числі і маркетингових спеціалістів, які не знають SQL.
Та й насправді звичайному аналітику теж життя трохи спрощується, бо вам же ніхто не забороняє швидко накидати простий запит в Table Explorer, скопіювати його і дописати у звичному режимі.
Про інші нюанси та обмеження можна почитати в офіційній довідці.
2. Як ви вже напевно зрозуміли, під капотом Table Explorer запускає звичайні SQL-запити, навіть коли ви не використовуєте фільтрацію, а просто виводите топ-10. Не забудьте про це, оскільки оплачувати їх саме вам)
Вебаналітик, Маркетолог