Дуже часто питають які задачі виконує DataEngineer
Ділюсь досвідом
🤓В групі
🔗Data Engineer UA
будемо обмірковувати ось таку звичайну задачу (дані в першому коментарі)
Вхідні дані, це логи змін статусу(тегу) користувача, якщо користувачу поставили тег, тоді в нього з'являється запис де
actions == 'create
', якщо видаляють
'delete'
.
Потрібно побудувати табличку (data mart) яка буде мати стан тегів для користувача на кожен день.
Умовний приклад очікуємого результату:
Вхідні дані
[
{
"id": 900001,
"user_id": 123,
"tag": "Tag_777",
"created_at": "2024-09-01 22:45:11.000000",
"updated_at": "2024-09-01 22:45:11.000000",
"actions": "create",
"is_by_user": False,
"manager_id": None,
"service": None,
"comment": None,
"years": 2024,
"dates": "2024-09-01",
"p_years": 2024,
"p_dates": "2024-09-01"
}
]
Очікуємий результат >>
[
{
"date_rep": "2024-09-01",
"user_id": 123,
"tag": "Tag_777"
},
{
"date_rep": "2024-09-02",
"user_id": 123,
"tag": "Tag_777"
},
{
"date_rep": "2024-09-03",
"user_id": 123,
"tag": "Tag_777"
},
{
"date_rep": "2024-09-04",
"user_id": 123,
"tag": "Tag_777"
}
]
Доєднуйтесь до обговорювань
🤗