Предлагаю сегодня в качестве эксперимента пробежаться по первой десятке.
Я буду давать короткие ответы, так что, вполне возможно, что на собеседовании вам нужно будет подольше развивать эти мысли🙃
1. У вас есть дашборд с графиками, на котором выводятся все средние метрики. Однажды вы просыпаетесь —
прибегает менеджер и говорит, что всё упало. Ваши действия, как вы будете эту проблему отслеживать?
Во-первых, убедимся, что не сломались сами данные: проверяем таблицы и обновляемость данных в них. Затем убеждаемся, что не сломался сам дашборд (логика расчёта, обновление по расписанию и тд). Если всё ок - присутпаем к исследованию причин реалнього падения метрики.
2. Что такое CAC и CPA и в чём разница между ними?
САС (Customer Acquisition Cost) - это издержки на привлечение одного (любого) клиента.
CPA (Cost per Action) - это стоимость одного клиентского действия, и этим действием вовсе не обязано быть "привлечение". СРА может рассчитываться относительно любого продуктового или финансового действия.
3. Расскажите, какие оконные функции вы знаете и как с ними работать?
- Ранжировочные оконные функции (row-number, rank, dense_rank) используются для проставления ранга в рамках определенной ранжировки.
- LAG/LEAD используются для перехода к прошглому или будущему значению в рамках ранжировки
- Группировочные функции в роли оконных используются для группировки таблицы без изменения её структуры.
4. Чем отличается left join от inner join?
При inner join в результирующей таблице остаются только ключи, которые присутствуют в обеих таблицах. В left join останутся все ключи из левой таблицы.
5. Почему вы выбрали именно аналитику?
Отвечу мемом во вложении😄
6. Смотрите: из того, что вы там делали, работа с Excel-таблицами — насколько хорошо вы знакомы? И умеете ими пользоваться?
Особый акцент хотелось бы сделать на автоматизации: настройка процессов ETL и другие процессы по автоматической очистке и подготовке данных для анализа и визуализации. Конечно же, построение сводных таблиц и графиков для ad hoc запросов.
7. Можете рассказать, какие виды ретеншена бывают? Что это такое? Для чего это нужно?
Retention - это показатель клиентского удержания, который чаще всего употребляется совместно с понятием "когорта".
- Абсолютный Retention Х - какое количество человек из когорты "дожили" до периода Х
- Относительный базовый Retention Х - какая доля от когорты "дожила" до периода Х
- Относительный цепной Retention Х - какая доля от доживших до прошлого этапа "дожила" до периода Х
8. Что такое ClickHouse?
Столбцовая система управления базами данных.
Обладает своим диалектом, который по некоторым нюансам отличается от более "классических диалектов", таких как MySQL или Oracle. В частности, допускает работу с массивами и имеет множество собственных функций, в первую очередь, для обработки массивов.
9. 10 станков производят слитки весом 10 кг. Один станок бракованный и производит слитки весом 9 кг. Есть весы с одной чашей. Нужно за одно взвешивание этих слитков (количество у вас неограниченное) определить, какой станок производит бракованные слитки. Какой из этих десяти станков?
Нам потребуется определить "меру ошибки": берём 10 деталей с 10 станка, 9 деталей с 9 станка и т.д. Рассчитываем насколько наши 55 деталей отличаются по весу от того, как должно было быть, и по масштабу ошибки определяем "виновный" станок.
10. Что вы знаете о джоинах (Join): чем отличаются, какие знаете?
- inner - "пересечение". т.е. остаются только ключи, которые были и в А и в В
- left - "левое пересечение". т.е. остаются только ключи, которые были в А
- right - "правое пересечение". т.е. остаются только ключи, которые были в В
- full - "объединение". т.е. остаются все ключи
- cross - Декартово произведение двух таблиц
#аналитика #тестовое #hh