⏰️ Тайминг:
Знакомимся с решениями задачи А – нужно было создать алгоритм, который предсказывает цену недвижимости.
⏳️1:45 – 12:51 – своё решение представила команда лиги «Обучающиеся» EXTREMUM (состав: Фаст Георгий, Суслов Ярослав).
Задание оказалось под силу только градиентному бустингу. При решении пригодились библиотеки Sklearn, Catboost, Seaborn и Pandas. Если хочешь узнать параметры модели и полученное значение метрики, смотри подробное описание решения по QR-коду на видео.
⏳️ 14:21 – 19:51 – решение этой же задачи представила команда ML Reference лиги «Продвинутые» (участники: Ларин Иван, Абрамов Георгий, Плюснин Антон).
Занять первое место и получить лучшее решение помогло логарифмирование таргета, Feature Engineering, обучение модели с помощью Catboost и подбор гиперпараметров c Optuna. Смотри презентацию победителей на видео, чтобы узнать финальные результаты.
👉 Переходим к задаче B!
⏳️ 20:50 – 32:00 – в решении этой задачи нужно было обязательно использовать фотографии объектов. Абсолютным победителем стал Иван Савкин из Новосибирска. Как ему это удалось? Он использовал двухступенчатый градиентный бустинг, где первая ступень – LGB-регрессор, а вторая – предобученная нейросеть.
👉 Разберём задачу С, где нужно было классифицировать описания фильмов с сайта КИНОПОИСК по жанрам.
⏳️ 32:32 – 38:00 –решение команды «ML Reference», занявшей второе место (состав: Рыжичкин Кирилл, Хабибуллин Адиль). Ребята дообучали LLM, также использовали правильные ответы из обучающего датасета.
👉 Переходим к сложным задачам. Задача D – от компании МТС по предсказанию оборота сервиса бронирований на месяц.
⏳️ 38:58 – 49:00 – Лучшее решение от команды «Bubble team» (участники: Пузаков Антон, Жолобов Олег, Коробков Юрий). Для каждого региона использовали свою модель, свой P rophet с сезонностью и праздниками и фичу в виде SARIMA. В конце суммировались результаты прогнозирования моделей.
🤯 «Гробовые» задачи в продолжении по ссылке.