(нравится оно вам или нет 😃)
Последний раз я остановилась на том, что мне удалось найти домашние и рабочие локации юзеров по их GPS-координатам, записанным в период 01/2019–09/2023.
С того момента я сделала три попытки оценить месячный уровень удаленной работы и хочу вкратце поделиться с вами результатами.
📌 Код можно найти у меня на GitHub
---
🔹 Идея 1:
📍 Удаленка = _доля домашних сигналов, случившихся в рабочие часы (11:00–16:00)_
🔸 Результат:
📊 При таком расчете уровень удаленки оказался самым высоким в 2019 г. и самым низким в месяцы локдауна (04–05/2020).
❓ Почему
🔹 В месяцах разная доля сигналов в рабочие часы.
🔹 В ковидные месяцы почти все сигналы записаны либо рано утром, либо поздно вечером.
---
🔹 Идея 2:
📍 Удаленка = _доля рабочих часов (11:00–16:00), в которые сигналы получены из домашней локации._
_Месяцы с низким числом рабочих часов исключены._
🔸 Результат:
📊 Сильный рост удаленки во второй локдаун (09/2020), но уровень удаленки в 2019 выше, чем в 2023.
❓ Почему
🔹 У юзеров разная частота рабочих часов внутри месяца.
🔹 Одна случайная домашняя локация в 11:00 при отсутствии других сигналов днем → доля удаленки = 100%.
🔹 Индивидуальные рабочие графики могут отличаться.
---
🔹 Идея 3:
📍 Удаленка = _доля часов, в которые у юзера вероятность быть на работе выше, чем в любой другой локации, но фактически он находился дома._
_При этом ни в один час того же дня юзер не посещал офис._
🔹 Как?
Используем Bayesian conditional probability :
P(O|h) = P(O) * P(h|O) / P(h)
где:
-
P(O|h)
- вероятность для юзера быть в офисе в конкретный час невыходного дня с 8 утра до 7 вечера-
P(O)
— доля офисных часов в дни посещения офиса. -
P(h)
— доля конкретного часа в офисные дни. -
P(h|O)
— доля конкретного часа среди часов с сигналом из офиса в офисные дни. Удаленка определяется как:
P(O|h) > P(H|h) & P(O|h) > P(3rdP|h)
& Home Location где:
-
P(H|h)
— вероятность для юзера быть дома в конкретный час. -
P(3rdP|h)
— вероятность для юзера быть в третьей локации в конкретный час.🔸 Результат:
📊 Резкий рост удаленки в период 04/2020–10/2020, постепенное снижение в 2021–2023, но доля все еще выше, чем в 2019.