Нескучный Data Science @not_boring_ds Channel on Telegram

Нескучный Data Science

@not_boring_ds


Нюансы работы в Data Science, о которых ты не узнаешь в школе
👨‍💻 Head of Machine Learning Laboratory @smirnovevgeny
https://www.linkedin.com/in/smirnov-evgeny/

Нескучный Data Science (Russian)

Нескучный Data Science - это канал, который призван раскрыть нюансы работы в области Data Science, о которых ты не узнаешь в школе. Если ты интересуешься машинным обучением, искусственным интеллектом и анализом данных, то этот канал станет для тебя настоящим кладезем знаний и новых идей. Ведущий канала - Head of Machine Learning Laboratory @smirnovevgeny, который с большим опытом делится своими знаниями и практическими советами. Присоединяйся к сообществу специалистов в области Data Science и узнавай о последних трендах и технологиях. Для более подробной информации о ведущем канала, вы можете посетить его профиль на LinkedIn: https://www.linkedin.com/in/smirnov-evgeny/

Нескучный Data Science

11 Nov, 15:30


🤔 Data Science в промышленности и в финтехе: где интереснее?

Насмотренность практических кейсов применения Data Science важна на всех уровнях и особенно на позициях выше Middle DS. Опыт внедрения ml-решений в промышленности сильно отличается от финтеха, ортогональная информация особенно полезна для обучения, поэтому особенно рекомендую к просмотру этот подкаст.

🗯 В промышленности есть огромные объёмы данных из разных источников, возможность решать нетривиальные задачи и строить жизненно важные прогнозы.
🗯 В финтехе задачи ближе к традиционным DS-алгоритмам: скоринг, риски, предиктивная аналитика. Больше рисков и ограничений, но процессы обкатаны и данные представлены, как правило, шире и лучше.
🗯 Софт-скиллы и хард-скиллы вроде бы нужны одинаковые, но со своими нюансами. Например, в промышленности никуда без знаний физики.

Новый эпизод «Деньги любят техно» о специфике работы DS вместе с Михаилом Граденко из «Русала» и Юлием Шамаевым из ВТБ:
Смотреть 💬
Слушать 🎧

Нескучный Data Science

04 Nov, 09:31


🧠 Хакатон по созданию AI-продуктов от T1

Предлагаю дополнить
ваши компетенции по AI командой из бекендера, фронтендера, системного аналитика и решить один из двух кейсов:

1️⃣ Хаб: объединение данных пользователя в золотую запись.
Создайте методику, которая поможет найти "золотую запись" в большом наборе данных, используя признаки актуальности, частоты и полноты.

2️⃣ Окно знаний: цифровой ассистент для базы знаний.
Создайте платформу, которая позволит пользователям взаимодействовать с ассистентом и интегрировать собственные базы знаний.

💸 Призовой фонд:
1 200 000 рублей на 2 кейса:
🥇1 место - 300 000 ₽
🥈2 место - 200 000 ₽
🥉3 место - 100 000 ₽

📆 Когда: 26-29 ноября 2024
Формат: гибридный

▶️ Регистрация открыта! Успей зарегистрироваться по ссылке до 24 ноября, 23:59 МСК.

Нескучный Data Science

26 Oct, 16:16


📈🗯 Расширяем Лабораторию в направлении LLM

🚀 Альфа-Банк активно развивает направления применения генеративного ИИ. Лаборатория находится в активном поиске 3-х junior/middle/senior + Team Lead под направление LLM. Качество текущего поиска определит, насколько быстро мы сможем выполнить стратегические задачи компании.

💸 Формирование команды - это одна из ключевых задач её руководителя. На этот раз инвестируем не только собственное время, но и 1️⃣0️⃣ подписок ✈️-премиум для повышения охвата этой вакансии вместе с дружественным каналом @neural, который рассказывает про актуальные сценарии применения LLM.

Как принять участие?
1️⃣ Подписаться на канал "Нескучный Data Science" (@not_boring_ds)
2️⃣ Подписаться на канал "Neural Networks | Нейронные сети" (@neural)
3️⃣ Ждать 15 ноября, когда мы объявим, кто победил.

Нескучный Data Science

24 Oct, 06:35


🚀 Запускаем соревнование по AutoML для студентов

🌿 Настало время оправдать название курса AutoML in Practice и закрепить полученные в нем знания. Каждый курс от Лаборатории обязательно подкрепляется соревнованием по анализу данных и в этом году мы не стали делать исключение. Уверен, оно вам точно зайдет, ведь на этот раз его готовили исключительно kaggle-мастера из нашей команды. Соревнование будет состоять из отборочного онлайн-этапа и очного офлайн-этапа.

1️⃣ В отборочном испытании вам предстоит решить одну из трех наших актуальных задач:

🔹Кредитный скоринг ЮЛ (вероятность дефолта, PD модели)
🔹Склонность физических лиц к инвестициям (Look-alike модели)
🔹Отток юридических лиц из расчётно-кассового обслуживания (CLTV модели)

2️⃣ В финальном этапе участники соревнования напишут свой AutoML, который сможет решить 15 различных задач.

Распределение призовых:
🥇1 место - 250 000 ₽
🥈2 место - 150 000 ₽
🥉3 место - 100 000 ₽

🗓Ключевые этапы:
🔹 22-31.10 — Подача заявок (дедлайн)
🔹 1-12.11 — Отборочный этап - онлайн
🔹 18.11-7.12 — Финальный этап -онлайн
🔹 7-8.12 — Финальный этап - офлайн

🚫Ограничения: К участию допускаются студенты 18-25 лет.

👉 Регистрируйся по ссылке на соревнование сейчас, чтобы закрепить полученные знания из нашего курса.

Нескучный Data Science

17 Oct, 16:33


🚀Команда Сбера🚀выложила в open-source самый большой датасет, содержащий мультимодальные банковские данные ЮЛ.

🔥Multimodal Banking Dataset (MBD)🔥

Датасет состоит из обезличенных исторических данных, содержащих следующую информацию по клиентам ЮЛ за 12-24 месяцев:
📌транзакционная активность (transactions);
📌эмбеддинги диалогов (dialogs);
📌гео-активность (geostream).

Таргет: предсказать для каждого пользователя взятие каждого из четырех продуктов в течение месяца после отчетной даты. Исторические данные за 2022 находятся в targets.

Датасет на HuggingFace:

🖥https://huggingface.co/datasets/ai-lab/MBD (14,6 GB, основной датасет)
🖥https://huggingface.co/datasets/ai-lab/MBD-mini (3,38 GB, уменьшенная версия, 10% клиентов из основного датасета)

Датасет опубликован под лицензией Creative commons 4.0, доступен для использования в научных работах, экспериментах итд.

Нескучный Data Science

16 Oct, 17:08


📚 Пришло время провести розыгрыш подарков для буста вашей карьеры

На этот раз мы разыграем целую коллекцию актуальных и нужных книг Дата Саентиста.

Условия просты:
👉 подписаться на Machine Learning,
👉 подписаться на Нескучный Data Science

Каждый победитель получит Telegram Premium и одну из книг, которые рекомендуют прочитать авторы каналов:

📖 System Design. Машинное обучение. Подготовка к сложному интервью | Сюй Алекс
📖 Глубокое обучение Курвилль Аарон, Гудфеллоу Ян
📖 Как быть успешным в Data Science.
📖 Все, что нужно, чтобы понимать математику в одном толстом конспекте
📖 Илон Маск | Айзексон Уолтер

Итоги подведем при помощи бота, который рандомно выберет победителя. Всем удачи ❤️

P.S. Не забывайте ставить огонек под этим постом. Поговаривают, что шанс на победу может увеличится ))) 🔥

Нескучный Data Science

16 Oct, 16:02


Разогреем эту осень на IT Talk by Sber в Омске! ⚡️

24 октября эксперты Сбера расскажут о сложных запросах в ClickHouse, импортозамещении технологических стеков и инструментах бизнес-аналитики.

Спикеры и темы:
Григорий Пилипейко, Senior Data-инженер – «Clickhouse и сложные запросы»
Светлана Ромашева, Senior Data-инженер – «Импортозамещение инструментов Business Intelligence на примере управленческой отчётности»
Александр Ткаченко, руководитель направления – «Как мы делали Корпоративный Портал, а получилась WEB-платформа "СРЕДА" для разработчиков и бизнеса».

Митап будет интересен всем без исключения, а особенно инженерам данных, владельцам продуктов и DB-инженерам.
Если это ты, то регистрируйся здесь!💚

Нескучный Data Science

07 Oct, 17:29


🚀 Комбинаторика для начинающих на STEPIK

🌿 Легендарный курс от Андрея Михайловича Райгородского теперь можно бесплатно пройти на платформе степик. Лично смотрел этот курс еще будучи студентом и впоследствии с его помощью освежал свои знания, когда проводил семинары по Комбинаторике на Физтехе.

📚 Этот курс предназначен для начинающих, которые хотят освоить основы комбинаторики с нуля, а также для тех, кто когда-то изучал этот раздел математики, но нуждается в обновлении и систематизации знаний. Как мне кажется, автор курса излагает его настолько доступным языком из-за искренней любви к предмету, что его можно смотреть даже продвинутым школьникам. Знание комбинаторики конечно же вам пригодится на собеседованиях по анализу данных.

🎁 В честь запуска разыграем книжку "Кому нужна математика?" авторства А.М. Райгородского с автографом автора!

Как принять участие?
1️⃣ Подписаться на канал "Нескучный Data Science" (@not_boring_ds)
2️⃣ Подписаться на Клуб любителей математики (@mathloversclub28)
3️⃣ Ждать 20 октября, когда мы объявим, кто победил.

👉 Давно не испытывали КАТАРСИС от математики? Самое время повторить!

Нескучный Data Science

26 Sep, 19:12


🎙Как мы прокачиваем навык публичных выступлений в команде?

🌿 Пару лет мне пытались навязать мнение, что выступать на конференциях джунам не стоит и относились с подозрением к спикерам этого уровня. Никак не мог с этим согласиться, так как это один из 🐳 развития моей команды. Мы уже давно поменяли эту парадигму и наши джуны рассказывают о своей работе не хуже синьоров и тим лидов.

Все получилось нативно без заказа отдельной стратегии под эту цель. Однако, постфактум, могу выделить следующие факторы, оказавшие положительное влияние на навык публичных выступлений моей команды:
1️⃣ Участие во всех коммуникациях со смежными командами в рамках решения своей задачи.
2️⃣ Самостоятельное составление первичного квартального плана с учетом всех этапом жизненного цикла модели и работ смежных команд.
3️⃣ Питчинг на регулярной основе о результатах своей работы на внутренних встречах Лаборатории.
4️⃣ Презентация результатов по ходу проекта смежным командам и руководителям любого уровня.
5️⃣ Помощь руководителя при подготовке материалов для первого публичного выступления в формате обратной связи, а не выполнения работ по ее подготовке.
6️⃣ Переиспользование внутренних материалов, шаблонов презентаций и банка оформленных слайдов.
7️⃣ Прогон материалов ровно столько раз, пока не получится.
8️⃣ Чувство товарищеского локтя и личный пример.

👉 Следование этим принципам позволяет быстро прокачивать команду в публичных выступлениях, тратить минимум времени на подготовку материалов и записывать курсы по машинному обучению без суфлера.

💪 Навык публичных выступлений позволяет вам получить должное признание за свою работу, а компании замотивированного члена команды, вовлекающегося в решение задачи end-to-end.

🗂 Рекомендую подписаться на папку с ит-спикерами, у которых вы сможете подчерпнуть больше опыта в этом навыке.

P.S. @Aleksey_Firstov уже стал тим лидом)

Нескучный Data Science

11 Sep, 07:05


#️⃣1️⃣Опубликовали первую научную статью от Лаборатории

📝Вместе с коллегами из Сколтеха, Иннотеха и ВТБ написали статью, посвященной анализу adversarial атак на банковские ML модели

🔬 Приняли активное участие в подготовке статьи - провели множество экспериментов, обучали модели и улучшали текст

⭐️ После множества улучшений нашу статью приняли на публикацию на международную конференцию ICDM 2024: IEEE International Conference on Data Mining, проходящую с 9 по 12 декабря в Абу-Даби!

Наша работа оказалась одной из 66 статей, которые будут представлены в формате Regular paper

📎 До официальной публикации статью можно прочитать на Arxiv: https://arxiv.org/abs/2308.11406

🤝 Хотим отдельно поблагодарить @fullyconnected за лидирование активности со стороны Лаборатории, и команду @likzet из Сколтеха за огромный вклад в написание и публикацию статьи!

Ставьте 🔥, если ждёте ещё статей от Лаборатории!

Нескучный Data Science

06 Sep, 17:55


🎫 AI Conf. Розыгрыш офлайн-билета + промокод

🎙 AI Conf пройдет уже 26-27 сентября в Москве в Старт Хабе. Программный комитет конференции уже отобрал порядка 50 лучших докладов. Наша команда расскажет про рецепт приготовления табличной нейронки и применение AutoML и AutoDL сервисов на практике.

🎁 Принес два подарка для подписчиков канала Нескучный Data Science:
1️⃣ Промокод friends, который дает скидку 15% на онлайн и офлайн билеты
2️⃣ Розыгрыш одного бесплатного офлайн-билета стоимость 75к рублей

Как выиграть билет на офлайн часть?
1️⃣ Указать в комментариях в канале @not_boring_ds к этому посту название наиболее заинтересовавшего вас доклада
2️⃣ Подписаться на каналы @not_boring_ds, @not_boring_ds_jobs и @UseDataConfChannel
3️⃣ Прокачать удачу таким образом чтобы генератор случайных чисел выбрал именно вас.

🗓 Подведем итоги в пятницу 13 сентября. 🙏 Желаю удачи!

Нескучный Data Science

04 Sep, 17:37


🤦‍♂️ Самая неловкая рабочая ситуация

Начнем с исторической справки чтобы вы смогли прочувствовать весь сюр и боль героя истории:
1️⃣ 2013-ый год. Переход c Windows на Ubuntu позволяет работать в Andoind Studio с 4 GB RAM на ноутбуке. В результате, перехожу полностью на Linux.
2️⃣ 2016-ый год. Покупаю mac, скопив первые три зарплаты. Он сохраняет все преимущества Ubuntu и позволяет подключиться к рабочему Outlook и другим сервисам практически в один клик вместо тонны команды на Ubuntu.

👇 Теперь перенесемся в 2018-ый год, за пять минут до кринжа.

🌐 В офисе (тогда еще не было удаленки) неожиданно пропадает интернет на macbook. Боготворя свое чудо техники, решаю искать проблему во внешнем мире. Сам починить внешний мир не могу, поэтому звоню в службу поддержки и прошу мастера проверить маршрутизатор.

👨‍🔧 Ко мне подходит мастер и просит перезагрузить macbook. Глубоко удивляюсь и даже возмущаюсь, полагая, что такой подход работает только на винде. Выполняю его рекомендацию и проблема чудесным образом устраняется. Так неловко я себя никогда не чувствовал ни до, ни после этого момента.

💬 Расскажите вашу кринжовую историю в комментариях

Нескучный Data Science

02 Sep, 16:25


🚀 Запустили бесплатный курс AutoML in Practice

🧑‍🎓 В курсе подробно разберем компоненты AutoML-сервисов, инфраструктуру для исполнения и бизнес-кейсы их применения.

💻 Кроме теории, вас будет ждать секция live-кодинга, на которой вы вместе с нами сможете реализовать свой собственный AutoML для реальных задач.

🌡 На данный момент мы уже разработали более сотни моделей при помощи сервисов ANNA и AMELIA. Поделимся с вами ключевыми инсайтами, которые мы уже получили на основе практического опыта.

🤔 Будем рады, если вы традиционно сможете переиспользовать наш опыт в прагматичном стиле. Однако, AutoML, как и любую автоматизацию, нужно внедрять тогда и только тогда, когда она действительно целесообразна. Мы позаботимся чтобы вы не присели на волну хайпа в самом начале курса.

👉 Герой фильма "Господин Никто" сделал выбор всей своей жизни, теперь ваша очередь.

Нескучный Data Science

28 Aug, 17:24


💬 Горизонты профессионального развития в Data Science 📅 29 августа 18:00

Приглашаю вас завтра на встречу в формате открытой дискуссии, где каждый желающий сможет задать интересующие его вопросы.

Основная часть будет построена вокруг следующих тематик:
1️⃣ Будущее и развитие DS. Какие интересные прикладные задачи стоят перед лидерами индустрии?
2️⃣ Где стоит применять LLM, а где стоит обойтись менее сложными моделями?
3️⃣ По какому вектору будет дальше развиваться "генеративный ИИ"?

Спикеры встречи:
- Андрей Кузнецов (AIRI) @complete_ai
- Евгений Смирнов (АЛЬФА-БАНК)
- Роман Поборчий (self-employed)
- Дани Эль-Айясс (Social Discovery Group) @cats_shredinger
- Александр Самойлов (Wildberries) @asamoylov

Регистрируйтесь на онлайн встречу и зовите коллег!

Нескучный Data Science

23 Aug, 09:53


🏔 Алгоритм поиска лучших гидов в Казахстане

🤔 После BeeTech Conf в Казахстане сразу следовали майские праздники. Было бы вовсе странно не воспользоваться этим прекрасным стечением обстоятельств чтобы лучше узнать эту страну.

🔍 Как опытный турист, я начал искать гидов, находясь еще в Москве, через поисковый запрос «Экскурсии в Казахстане», приложение GetYouGuide и linkedin. Первые два метода помогли мне найти двухдневную экскурсию на Чарынский каньон и озеро Кольсай. Однако этого было маловато для более, чем двухнедельного отпуска.

🤝 Linkedin случайно оказался мощным инструментом для решения и этой задачи. Изначально планировал только расширить профессиональные контакты, но этим все не ограничилось. @HumanoidRobot, @SayanOmarov не только показали богатство природы и рассказали историю Алматы, погрузили в особенности повседневной жизни, но и подготовили к поездке в Астану анекдотом.

🤡- Чем можно заняться в Астане?
- Купить билет в Алмату


🤝 @Rychko включил функцию гида с глубоким знанием истории Астаны, и я не купил билет обратно в Алмату.

🤔 В итоге, третий способ поиска гидов оказался более эффективным, чем первые два. Видимо, на позициях CDS и Head Of DS в Казахстане требуется сдавать экзамен по навыкам гида вместо кодовой секции.

Нескучный Data Science

22 Aug, 12:32


Технарские подкасты | Мой путь от Физтеха до руководителя Data Science

🤝
Душевно общаемся с Денисом Айвазовым @techmeta на протяжении 2 часов в Технарском подкасте!

🎙В подкасте затронули темы образования, организации досуга и некоторые другие:
1️⃣ Зачем ходить на пересдачи?
2️⃣ Чему полезному научили на физтехе?
3️⃣ Зачем дата сайентисту знать историю?
4️⃣ Зачем нужна деверсификация в жизни?
5️⃣ Обязательно ли выбирать прямой путь из точки "А" в точку "Б"?
6️⃣ Как выйграть телефон в интернете школьнику?
7️⃣ Где я работал после первого курса?
8️⃣ Как эстетика и искусство связано с разработкой качественного продукта?
9️⃣ Как совмещать спорт и работу?

📹 Подключайтесь к нашей беседе!

Нескучный Data Science

19 Aug, 14:35


🙏 Личная консультация за донат на благотворительность | ❤️Meet for Charity

💪 Meet For Charity собрал уже более 334 миллионов рублей пожертвований, разыгрывая встречи с известными людьми - представителями бизнеса, медиа, культуры, политики и спорта - в поддержку разных благотворительных фондов. Деньги идут на помощь более 160 благотворительным организациям: Дом с маяком, Линия Жизни, Онкологика, ОРБИ, Антон тут рядом, Детские Сердца, Движение вверх, Ночлежка, и многим другим. Героями проекта стали более 800 участников.

В рамках консультации в онлайн или офлайн формате сможем обсудить любые вопросы, но большую пользу смогу принести по следующим темам:
1️⃣Применение ИИ в бизнесе или монетизация данных;
2️⃣ Построение карьеры в Data Science;
3️⃣ Построение высокоэффективных команд;
4️⃣ Развитие личного бренда для IT-менеджера;

Собранные по итогам аукциона средства будут направлены в фонд Нить добра.

👉 Участвовать в аукционе

Нескучный Data Science

14 Aug, 13:32


❤️Beetech Conf 2024 и Казахстан

Конференция Beetech Conf стала идеальным pre-party перед майскими праздниками в Казахстане, в отличной компании и шикарной природой. Гостеприимство в этой стране на особом уровне, которому нам стоит поучиться. Спасибо @BeeTech_meetup, Каспи Банк, @alexdral, @HumanoidRobot, @Rychko

Доклады с конференции выложили в открытый доступ.
Рекомендую посмотреть весь плейлист, в особенности следующих спикеров:
1️⃣ Никита Бобух. Как сделать mvp-сервис A/B-тестирования за месяц.
2️⃣ Айнур Махмет и Нурлан Жакин. RAG’n’Roll: делаем чат-бот умнее при помощи LLM.
3️⃣Владимир Колесников и Антон Багин. Подходы к мониторингу моделей.

💬 А вы были на озерах Кольсайских озерах и Чарынском каньоне?