Нескучный Data Science Jobs @not_boring_ds_jobs Channel on Telegram

Нескучный Data Science Jobs

@not_boring_ds_jobs


Нескучные позиции в Data Science

Нескучный Data Science Jobs (Russian)

Вы устали от скучных и однообразных вакансий в области Data Science? Тогда канал "Нескучный Data Science Jobs" идеально подойдет для вас! Здесь вы найдете самые интересные и перспективные позиции в сфере науки о данных

Кто мы? Мы - команда профессионалов в области Data Science, которая заботится о том, чтобы вы всегда были в курсе самых актуальных и увлекательных вакансий. Наш канал предлагает только лучшие предложения работы, от ведущих компаний и стартапов, которые ищут талантливых специалистов в области анализа данных

Что такое "Нескучный Data Science Jobs"? Это источник вдохновения и возможность найти идеальную работу, которая будет не только приносить вам удовлетворение, но и помогать вам развиваться как специалисту. Мы собираем для вас только те вакансии, которые отличаются интересными задачами, перспективами карьерного роста и достойной оплатой труда

Присоединяйтесь к нам, чтобы быть в курсе всех новостей и предложений в области Data Science! Вместе мы сделаем ваш поиск работы увлекательным и результативным. Давайте вместе создадим будущее вместе с "Нескучный Data Science Jobs"!

Нескучный Data Science Jobs

09 Jan, 15:49


Позиция: Quant Analyst (aka Data Analyst Developer)
Куда? Teza Technologies - systematic quantitative hedge-fund
Формат работы: Гибрид - Ереван, Армения (помогаем и рефандим релокацию)
Вилка гросс: 3 500 - 5 500 $

Что нужно делать?
- Сбор, oчистка и переработка данных: Сбор данных из различных источников (market feeds, APIs, внутренние базы данных)
- Проведение разведочного анализа данных (EDA)
- Анализ данных для оптимизации существующих стратегий
- Создание аналитических моделей и инструментов (включая инструменты real-time визуализации)
- Репортинг и презентация данных - подготовка отчетов, дашбордов и тд
- Разработка и автоматизация отчетов для инвестиционных и операционных команд

Требования:
- Интерес к трейдингу
- Bachelor / Masters в области Computer Science, Applied Math etc
- Минимум год опыта (крипта, финансы, трейдинг, банкинг и т.д.) в роли аналитика, исследователя или в похожей позиции
- Практические знания аналитики данных на Python и SQL
- Умение презентовать сложные данные в понятной и доступной форме (инструменты: Tableau / Power BI, matplotlib / seaborn)
- Навыки бизнес-коммуникации для понимания потребностей кросс-функциональных команд и эффективного сотрудничества с коллегами
- Базовые знания статистики, линейной алгебры, мат аналитики и теории вероятности
- Внимание к деталям
- И ещё раз: Интерес к трейдингу (так как работа с данными из трейдинга, в трейдинге, для трейдинга)

Ответы на 10 важных вопросов:
1 Данные: от биржи (пример: Binance)
2 Железо: В дате - In-house cloud + on-premise
3 Масштаб влияния: Направление crypto части бизнеса компании + свобода технически развивать аналитическую функцию локально
4 Уровень развития Data Science: компания занимается алгоритмическим трейдингом, поэтому data science / analytics / engineering ежедневно и стратегически важные компоненты бизнеса
5 Роль дата сайентиста: У нас роль Квант Аналитика / Девелопера - основные задачи, как описано в посте
6 Бэкграунд у вашего руководителя - VP - отвечает за Крипто часть бизнеса. По техническим вопросам помогут Сеньор Девелоперы из Real-Time Дата команды.
7 Как часто будут мешать работать? Через день синки с лидом + групповые встречи crypto команды
8 Карьерный рост: Возможности роста и вертикальные (Стать старшим аналитиком в будущем), и горизонтальные (двигаться в другие команды в будущем, если есть интерес, допустим в дата engineering / quant рисёрч)
9 Prod/Research: Сложно уточнить для аналитика.
10 Функция сервиса или лидера: инициатива поощряется, так как это "новая" должность.

Направляйте резюме: [email protected] / @vera_grigorian

Нескучный Data Science Jobs

21 Dec, 08:04


Позиция: Junior/Middle/Senior DS под задачи AutoML и AutoDL

Куда: Альфа-Банк, Лаборатория машинного обучения

Формат работы: полная занятость; офис в Москве; на данной позиции возможна полная удаленка, нет требований ходить в офис

Вилка гросс:
Junior: 120-240K + ежеквартальная премия (~15% от дохода за квартал)
Middle: 240-450k + ежеквартальная премия (~15% от дохода за квартал)
Senior: 360-570k + ежеквартальная премия (~15% от дохода за квартал)

Премия не зависит от kpi и ревью с плюсиками, фактический покрывает налог.

Про нас:
Направление ML автоматизации в Лаборатории машинного обучения Альфа-Банка. Мы разрабатываем SOTA AutoML/AutoDL решения - сервисы и библиотеки, которые автоматически строят крутые ML модели, улучшая инструментарий для повышения эффективности работы банковских DS. Флагманские продукты - AutoML AMELIA и AutoDL ANNA, кроме этого есть набор других сервисов. Сервисы ежедневно используются в работе десятками DS.

В направлении 4 человека: 2x Kaggle Competition Master (Team Lead и Senior), 1x Middle, 1x Junior.

Что предстоит делать?
- ML разработка полного цикла: улучшение качества алгоритмов автообучения нейросетей/бустингов на широком классе задач, оптимизация скорости решений, проведение бенчмарков, улучшение пользовательского опыта библиотек/сервисов, поддержка пользователей (технически подкованных DS)
- Работа совместно с командами DE, MLOps, Мониторинга над интеграцией решений в промышленную среду
- Лидерство новых направлений развития ML автоматизации

От нас:
- Постоянное карьерное и личностное развитие: амбициозные задачи, полный цикл разработки, выступления на конференциях
- Нет дейликов, минимум бесполезной активности
- Новые макбуки
- ДМС со стоматологией, сервис с юристами/психологами/коучами

Требования:

- Опыт работы в DS/ML
- Отличное знание бустингов
- Отличное знание Pytorch
- Высшее образование (оконченное или учишься) в области компьютерных наук, математики или смежных дисциплин
- Английский язык на уровне чтения технической документации

Будет большим плюсом:
- Успех в ML-соревнованиях
- MLOps стек/навыки (Jenkins/Airflow/Kuber... в дополнение к ML)
- Опыт с Pyspark/Hadoop

Ответы на 10 важных вопросов в оригинальной статье (https://habr.com/ru/company/alfa/blog/709416/).
Про непосредственного руководителя - linkedin

Резюме направляйте на почту [email protected] с темой «DS в Лабораторию»

Нескучный Data Science Jobs

03 Dec, 07:01


Устроиться аналитиком в Яндекс за выходные

7–8 декабря проводим Weekend Offer Analytics. До 4 декабря оставьте заявку на участие, 7 декабря пройдите технические собеседования, а 8 декабря познакомьтесь с командами и получите офер.

В мероприятии участвует 7 команд: Crowd, Карты, Поиск, YaGPT 2, Автономный транспорт, Реклама и Ecom-сценарии. Вы сможете пообщаться с менеджерами и выбрать проект, который покажется самым интересным.

Нанимаем в офисы России и Республики Беларусь.

Узнать подробности и зарегистрироваться можно здесь.

Нескучный Data Science Jobs

22 Nov, 11:22


Позиция: Руководитель проектов Data Science (AI-продакт) в команду развития лояльности
Компания: Альфа-Банк
Локация: Москва, м. Технопарк (гибрид, 1-2 дня в офисе)
Вилка гросс: 400-600k + ежеквартальная премия

В Альфа-Банке уже внедрены сотни моделей машинного обучения и сорвано большинство низко-висящих фруктов. Дальнейшее развитие возможно через глубокое погружение бизнеса в нюансы Data Science. Новый член команды поможет нам сократить оставшийся гэп между бизнесом и Data Science. Эта позиция в бизнес-подразделение для специалиста, который хорошо разбирается в Data Science (но не будет делать его своими рукоми), проектном менеджменте и обладает хорошими софт скиллами.

Задачи:
— Повышать уровень монетизации действующих моделей в продуктах лояльности;
— Разрабатывать и внедрять стратегию покрытия бизнес-процессов моделями;
— Брать лидерство в части реализации крупных и сложных внедрений (10-15% от общего бэклога);
— Формировать и защищать бэклог разработки моделей по задачам в рамках своей зоны ответственности;
— Находить лучшие практики в других подразделениях и внедрять в зоне своей ответственности;
— Обогащать бизнес технической экспертизой, а датасаентистов погружать в бизнес-цели и потребности.

Что ожидаем от кандидата:
— Опыт создания или оптимизации банковских бизнес-процессов;
— Знание и понимание основных принципов и алгоритмов машинного обучения;
— Опыт кросс-функционального руководства командами DS и бизнеса;
— Знание и умение применять основные метрики оценки качества моделей;
— Понимание принципов внедрения изменений в продукты/процессы (управление бэклогом, синхронизация различных команд);
— Знание и понимание передовых рыночных решений в части ИИ;
— Опыт разработки моделей ИИ и их внедрения в промышленную эксплуатацию;
— Знание и понимание жизненного цикла разработки моделей.

1. Данные: Hadoop + частично DWH. Историчность с 2016 г.
2. Железо. Разработка моделей: до 64 ядер CPU + 600 ГБ RAM + 2xNVIDIA A100 80GB. Продакшн: cистема исполнения моделей + команда MLOps + команда DE + команда поддержки. Для работы: MacBook.
3. Масштаб влияния на core-бизнес. Все линии бизнеса покрыты ML моделями, где необходимо – успешно внедрен DL.
4. Уровень развития Data Science. Все ключевые процессы покрыты моделями. Модели постоянно совершенствуются в целях максимизации финансового эффекта.
5. Роль дата сайентиста. Не применимо для данной позиции.
6. Бэкграунд у вашего руководителя. LinkedIn
7. Как часто вам будут мешать работать. Работа проектная => около половины времени - это встреч со смежными командами
8. Карьерный рост. Подразделение только формируется => потенциал вертикального роста
9. Prod/Research. Prod.
10. Функция сервиса или лидера. Функция лидера

Резюме направляйте на почту [email protected] ✉️ с темой "Руководитель проектов Data Science лояльность"

Нескучный Data Science Jobs

21 Nov, 14:58


Позиция: Junior/Middle/Senior DS + Team Lead NLP под задачи LLM
Куда: Альфа-Банк, Лаборатория машинного обучения
Формат работы: полная занятость; офис в Москве; на данной позиции возможна полная удаленка, нет требований ходить в офис
Вилка гросс:
Junior: 120-240K + ежеквартальная премия (~15% от дохода за квартал)
Middle: 240-450k + ежеквартальная премия (~15% от дохода за квартал)
Senior: 360-570k + ежеквартальная премия (~15% от дохода за квартал)
Team Lead: 400-700k + ежеквартальная премия (~15% от дохода за квартал)

Премия не зависит от kpi и ревью с плюсиками, фактический покрывает налог.

Про нас:
Мы NLP команда Лаборатории машинного обучения Альфа-Банка (под руководством Жени Смирнова). Занимаемся моделями для чат-ботов и голосовых помощников, автоматизируем контроль качества, ищем инсайты в обратной связи клиентов, упрощаем жизнь сотрудникам колл-центра и ускоряем внутреннюю техподдержку с помощью NLP.

Команда состоит из сильных молодых ребят, выпускников ШАД, МФТИ, МГУ, ВШЭ. Мы регулярно участвуем в соревнованиях и хакатонах, в команде несколько kaggle мастеров.
Альфа поддерживает успехи в соревнованиях премией в одну зп за первое место, и в половину зп за второе.

Мы занимаемся полным циклом разработки: от общения с заказчиком с переводом задачи на ml-ный язык до внедрения моделей в промышленный контур. А помогает нам команда разметки, mlops, мониторинга и другие.

Плюшки: гибкий график (нет требований начинать работать в 10:00, главное выполнять задачи вовремя и соблюдать коммуникацию с контрагентами), отличный ДМС со стоматологией, рабочие макбуки, корпоративные скидки.

На этой позиции предстоит разрабатывать ассистентов и чат-ботов на основе LLM для внешних клиентов Банка и для внутренних сотрудников, развивать и применять генеративный ИИ в реальных продуктовых проектах.

Тебе предстоит:
- Строить RAG-пайплайны для обслуживания сотрудников и клиентов Альфы
- Дообучать LLM на банковском домене данных
- Развивать retriever, улучшать поиск
- Использовать LLM для автоматизации процессов банка
- Внедрять разработанные модели в продакшн, приносить банку пользу и реальные деньги

Требования:
- Опыт работы в области машинного обучения и NLP (3+ лет для Senior)
- Знание, понимание архитектур и опыт работы с моделями, такими как GPT, BERT и другими
- Уверенные знания Python и библиотек для машинного обучения (TensorFlow, PyTorch, transformers…)
- Знание основ работы с большими данными и опытом их обработки (Spark, Hadoop)
- Высшее образование в области компьютерных наук, математики или смежных дисциплин
- Английский язык на уровне чтения технической документации

Будет плюсом:
- Опыт работы с RAG пайплайнами и LLM моделями
- Успешный соревновательный опыт
- Широкий технический кругозор

На позиции тимлида предстоит:
- управлять командой в 5+ человек
- проактивно приносить реальную пользу бизнесу с помощью NLP (особенно LLM)
- вести тесную коммуникацию с заказчиками

Ответы на 10 важных вопросов в оригинальной статье.

Резюме направляйте на почту [email protected] с темой «NLP Engineer в Альфа-Банк» или «NLP Team Lead в Альфа-Банк»

Нескучный Data Science Jobs

21 Nov, 12:12


Позиция: Стажер дата-аналитик
Компания: Х5 Group
Формат: Продолжительность стажировки 4-6 месяцев (full-time - 40 часов в неделю!)
Локация: Удаленная работа (но по желанию можно работать из офиса, г. Москва)
Вилки: Оклад 60 тыс.руб. gross
Начало стажировки: ~январь 2025 г.

💡Команда ad-hoc аналитики из X5 Group (Пятерочка, Перекресток, Чижик и etc) в поисках стажеров!

🔬Почему у нас интересно?
Более 20 тысяч магазинов, 15 миллионов клиентов, петабайты данных - и все это нужно анализировать. Каждый день мы показываем, что наши супермаркеты - на самом деле цифровой проект, в котором большое место занимают Big Data и Data-Driven подход.
Мы в команде ad-hoc аналитики крутим AB-тесты в оффлайне и не только, с каждым днем все больше прилетает нестандартных задачек, в которых мы используем все свои знания (или быстро их приобретаем), а также у нас можно заниматься рисерчами!

🔭Задачи:
Чем у нас занимаются стажеры?
- Первое время проходят онбординг, запоминают имена ментора и тим-лида и погружаются в курс дела
- Сразу после этого получают свою первую настоящую боевую задачку (и НЕ страдают, так как ментор всегда под рукой) на дизайн или оценку будущего эксперимента
- Продумывают дизайн А/B-тестов на магазинах или лояльных клиентах и интерпретируют их результаты, а также помогают руководителям инициатив (бизнесу) в этом
- Исследуют новые метрики на применимость А/B-тестов
- и многое чего еще

😎Ты нам подходишь:
- Если уже загуглил, что такое "ad-hoc" и понял, в чем суть
- Уверенно владеешь Python (pandas, numpy, matplotlib и весь базовый набор для аналитики данных), SQL (join'ы, оконки), знаешь статистику
- Обладаешь аналитическим складом ума, наблюдательностью и успешно практикуешь метод пристального взгляда
- Любишь мемы (желательно, но необязательно)
- Преимуществом будет владение бигдатой и ML

Что мы предлагаем:
- Помощь менторов на всем этапе стажировки
- Классный коллектив, теплая атмосфера и веселые ретро с играми и битвой мемов, а также оффлайн-тимбилдинги

Ответы на 10 важных вопросов :
1. Данные: данных петабайты, стек Hadoop, Hive, Spark.
2. Железо: под команду 2 сервера под расчеты, каждый Intel Xeon 32Core 256 GB RAM Bare Metal.
Данные храним в Hadoop.
Что касаемо ноутбуков - выдаются HP /Macbook Pro/ Dell.
3. Масштаб влияния на core-бизнес? Решаемые задачи затрагивают 20000 магазинов по всей стране.
4. Уровень развития Data Science в компании? Data Science в компании выделен как одно из ключевых направлений.
5. Роль дата сайентиста: полный цикл от понимания бизнес потребности до внедрения решений для решения ее.
6. Бэкграунд у вашего руководителя? https://www.linkedin.com/in/amsakhnov/
7. Как часто вам будут мешать работать? мешать работать не будем, 3-4 часа регулярных встреч в неделю
8. Карьерный рост: рост по результатам performance review, которые проводятся 2 раза в год.
9. Prod/Research: задача может быть любая, так что research + prod
10. Функция сервиса или лидера? На этапе стажировки 100% сервис.

Свои CV и вопросы направлять сюда: tg @didi_ulyanova

Нескучный Data Science Jobs

07 Nov, 18:12


Позиция: Руководитель направления мониторинга NLP-моделей
Куда? Альфа-Банк, Департамент продвинутой аналитики, Отдел аналитики качества моделирования
Формат работы: Гибрид - Москва, м. Технопарк + удаленно.
Вилка гросс: 350-400K gross + ежеквартальный бонус ~ 15% (от дохода за квартал). С учетом бонуса Gross превращается в Net.

Чем предстоит заниматься:
Организовывать и обеспечивать непрерывную работу команды мониторинга и аналитики моделей Лаборатории Машинного Обучения, как правило это нейронные сети, NLP модели;
Реализовывать и поддерживать процессы мониторинга моделей согласно требованиям бизнес-заказчиков и разработчиков;
Регулярно информировать заинтересованные стороны о состоянии моделей, разработав доступные подходы к презентации материалов: “бизнес-метрики для бизнеса, математика для математиков”. Выступать на коллегиальных органах с презентациями о состоянии моделей.
Разрабатывать и поддерживать методологию мониторинга и модельной аналитики;
Участвовать в решение общекомандных задача команды мониторинга;
 
Наши пожелания к кандидатам:
Опыт управлением команды от 2-х человек;
Владение Python (statsmodels, seaborn, pyspark и т.п.) и SQL на высоком уровне в связке с Hadoop, Spark, Hive;
Опыт работы с инструментами визуализации, желательно PowerBI;
Хорошие знания в области математической статистики;
Умение доносить сложные математические идеи до бизнес-заказчиков;
Опыт постановки бизнес-требований, разработки и описания новых бизнес-процессов;
 
Не обязательно, но будет здорово, если есть:
Наличие опыта в А/Б-тестировании;
Знание основных методов машинного обучения (особенно NLP), опыт их применения к организации экспериментов на больших наборах данных;
Опыт работы с AirFlow;
Опыт разработки методологических положений и инструкций по проведению экспериментов;
 
Мы предлагаем:
Работу в сильной команде выпускников Физтеха, ШАДа, МГУ и ВШЭ — всегда есть, у кого поучиться
Работу как из дома, так и из офиса на Технопарке
Понятный и общеизвестный модельный и технологический стек
Регулярные митапы внутри и за пределами Альфа-банка
Корпоративное обучение
ДМС со стоматологией

Ответы на 10 важных вопросов:
1. Данные: Данных много. Обычно - Hadoop (все данные Альфа-Банка). Могут быть эзотерические источники – локальные БД (нужно будет перенести на Hadoop).
2. Железо: Потенциально – 2 TB RAM, 96 cores. Будем отталкиваться от необходимости и можем расширять аллокацию ресурсов.
3. Масштаб влияния на core-бизнес? Бизнес будет счастлив с пониманием, что все его продвинутые NLP-модели регулярно мониторятся и работают корректно.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль: см. что нужно делать (выше).
6. Бэкграунд у вашего руководителя? LinkedIn
7. Как часто вам будут мешать работать? Почти ежедневно есть разные регулярные встречи с заказчиками или командой. Необходимо много общаться.
8. Карьерный рост: Лаборатория Машинного Обучения активно развивает покрытие своими моделями бизнеса, что увеличивает поток заказчиков и развитие функции.
9. Prod/Research: 70/30, разработка витрин и методологий тестирования с учетом лучших практик
10. Функция сервиса или лидера? Скорее сервиса, здесь четко обозначен контур задач. Но это повод для амбиции разорвать шаблоны.

Присылать резюме на [email protected] и [email protected] с темой письма: «Мониторинг NLP».

Нескучный Data Science Jobs

25 Oct, 19:13


Позиция: Ведущий математик-разработчик + Младший математик-разработчик (да, в этот раз без мидлов)
Куда: Озон Fintech, Отдел моделирования банковских продуктов, Группа моделирования продуктов B2C.
Формат работы: Офис в Москве, м. Международная, либо офис в или Санкт-Петербурге, либо удаленно, либо гибрид
Вилка гросс:
- Младший: 150-230
- Ведущий: 330-530
Доход посчитан с учетом полугодовой премии при базовой оценке “соответствует ожиданиям”. При хорошем перформансе доход будет выше.

Тебе предстоит:
- Разрабатывать и поддерживать ML-модели для кредитования физических лиц (PD, LGD, EAD, модель дохода и тд)
- Выводить в прод разработанные модели с помощью нашей ML платформы.
- Развивать внутренний фреймворк для разработки моделей
- Генерировать новые фичи и записывать в feature store (кстати их 2, отдельно для разработки моделей, отдельно для использования в онлайн в проде)
- Участвовать в постановке задачи, находить приоритетные направления для моделирования и прозрачно об этом рассказывать (младшему разработчику с этим поможем)
- Анализировать эффективность моделей в проде, организовывать и дорабатывать мониторинг.

Требования для ведущего :
- Опыт работы в кредитном скоринге от 3 лет
- Понимание, как провалидировать модели и как организовать мониторинг так, чтобы минимизировать модельные риски
- Умение работать с данными. Селектить откуда угодно. Генерировать крутые фичи для моделей. Вычислительно эффективно и с самопроверкой.
- Глубокие знания теорвера, машинного обучения, типовых пайплайнов обучения моделей (да, банально, но нужно)
- Опыт работы c пакетами для анализа данных и построения ML моделей на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, hyperopr, optuna, etc) (да, тоже банально, но как без этого?)

Требования для младшего:
- Опыт в построении моделей машинного обучения от 1 года
- Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов
- Хорошее знание теории вероятностей, математической статистики и методов машинного обучения
- Опыт работы c пакетами для анализа данных и построения ML моделей на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc)
- Общие представления о валидации и способах построения мониторинга моделей

Будет плюсом:
- Опыт работы с HDFS и Pyspark
- Навыки использования deep learning алгоритмов
- Навыки создания дагов Airflow и их последующее сопровождение
- Опыт в разработке, выводе в прод и поддержке сервисов для онлайн расчета моделей машинного обучения

Реклама про работу у нас:
- Про Озон Финтех посмотреть можно тут https://job.ozon.ru/fintech/
- Плюшки сотрудникам описаны тут https://job.ozon.ru/fintech/benefits
- Есть IT аккредитация

Ответы на 10 важных вопросов:
1. Данные: обилие данных маркетплейса Озон + классические данные физтеха
2. Железо: Разработка моделей: kuber с ресурсами под потребность. Продакшн: ML Platorm для быстрого внедрения моделей. MacBook для работы. В офисе удобное кресло и монитор
3. Масштаб влияния на core-бизнес. Модели - основа кредитного бизнеса и важная составляющая большинства продуктов компании
4. Уровень развития Data Science в компании. Высокая степень зрелости
5. Роль дата сайентиста: ДС-ы участвуют в постановке задачи совместно с заказчиками, обучают и документируют модель, напрямую катят сервисы в прод, сопровождают модели после внедрения
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 2 часа организационных встреч в неделю.
8. Карьерный рост: Ревью раз в пол года.
9. Prod/Research: Prod. Модели должны приносить пользу бизнесу.
10. Функция сервиса или лидера? Больше функция лидера, нужно помогать бизнесу находить точки роста

Откликнуться можно любым удобным способом
- через описание вакансии на портале
Младший разработчик https://job.ozon.ru/fintech/vacancy?id=109138566
Ведущий разработчик https://job.ozon.ru/fintech/vacancy?id=109138253
- написать в один из ТГ аккаунтов: @ida_it, @v0lkoff
- тправить резюме на один из адресов почты: [email protected], [email protected]

Нескучный Data Science Jobs

23 Oct, 07:02


Позиция: 3 x Junior/Middle/Senior DS + Team Lead NLP под задачи LLM
Куда: Альфа-Банк, Лаборатория машинного обучения
Формат работы: полная занятость; офис в Москве; на данной позиции возможна полная удаленка
Вилка гросс:
Junior: 120-240K + ежеквартальная премия (~15% от дохода за квартал)
Middle: 240-360k + ежеквартальная премия (~15% от дохода за квартал)
Senior: 360-460k + ежеквартальная премия (~15% от дохода за квартал)
Team Lead: 400-700k + ежеквартальная премия (~15% от дохода за квартал)

Про нас:
Автоматизируем обработку обращений клиентов с помощью чат-ботов и голосовых ассистентов. Наши модели снижают рутину в работе операторов и ускоряют решение запросов пользователей. Мы решаем широкий спектр задач в области NLP: от поиска инсайтов в обратной связи клиентов до автоматизации контроля качества контактного центра.
Команда приступает к следующему этапу развития через развитие экспертизы в LLM, чем и предстоит заниматься в рамках этой вакансии.

Тебе предстоит:
- Строить RAG-пайплайны для обслуживания сотрудников и клиентов Альфы
- Дообучать LLM на банковском домене данных
- Развивать retriever, улучшать поиск
- Улучшать качество и эффективность моделей ассистента оператора
- Использовать LLM для автоматизации процессов разметки данных

Требования:
- Опыт работы в области машинного обучения и NLP (3+ лет для Senior)
- Знание, понимание архитектур и опыт работы с моделями, такими как GPT, BERT и другими
- Уверенные знания Python и библиотек для машинного обучения (TensorFlow, PyTorch, transformers…)
- Знание основ работы с большими данными и опытом их обработки (Spark, Hadoop)
- Высшее образование в области компьютерных наук, математики или смежных дисциплин
- Английский язык на уровне чтения технической документации

Будет плюсом:
- Опыт работы с RAG пайплайнами и LLM моделями (LLaMA, GPT, Mistral…)
- Успешный соревновательный опыт
- Широкий технический кругозор

На позиции тимлида предстоит:
- управлять командой в 5+ человек
- проактивно приносить реальную пользу бизнесу с помощью NLP (особенно LLM)
- вести тесную коммуникацию с заказчиками

Ответы на 10 важных вопросов в оригинальной статье.

Резюме направляйте на почту [email protected] с темой «NLP Engineer в Альфа-Банк» или «NLP Team Lead в Альфа-Банк»

Нескучный Data Science Jobs

01 Oct, 18:03


Позиция: Middle+/Senior ML Engineer на все руки
Куда: Life Pay
Формат работы: Полная занятость. Гибридный график: Москва (офис на Арбате), возможны командировки в MENA и ЮВА, готов обсуждать удаленку
Вилка (net): 250-300k/350-450k соответственно

Про нас: LIFE PAY — Series B стартап, 119 место в рейтинге 500 быстрорастущих технологических компаний Smart 500, разработчик платежных, кассовых и учетных программных продуктов для ритейла и сферы услуг. Я (@flashnik, выпускник МФТИ, ex-Kaggle top-300, делал решения для 9 отраслей, более 500 моделей на проде) собираю с нуля команду для запуска нового направления - создания ML/AI-First продуктов в РФ и в Global. Сейчас в команде есть один бизнес-аналитик (и еще одна вакансия) и 2 вакансии на ML-инженера.

В течение ближайших нескольких месяцев нашей AI-команде нужно нащупать бизнес-модель и найти product-market fit - а для этого придется делать много PoC, придумывать и создавать MVP, а также выбрать и развернуть (с помощью девопсов) инфру. После выбора продуктовой ниши и перехода в стадию развития продукта можно будет сконцентрироваться на одной из предметных областей/одном из продуктов.

Что предстоит делать:
- Все, что необходимо сделать со стороны технологий для запуска и взлета (ToTheMoon) AI-направления;
- Создание технологических PoC и запуск MVP;
- Анализировать работу сторонних моделей (OpenAI, Anthropic, …) и строить прототипы на их основе;
- Собирать датасеты и обучать модели для классического ML (прогнозирование временных рядов и не только, работа с транзакционными данными, классификация, рекомендашки);
- Анализировать сторонние решения для оценки качества их работы;
- Применять CV для решения бизнес-задач (например, распознавание товаров на фото);
- Разрабатывать/файнтюнить и внедрять модели с GenAI для текстов и картинок/видео;
- Внедрять AutoML;
- Разрабатывать сервисы с моделями, к которым будет интегрироваться бэкенд и фронтенд;
- Создавать задачи на разворачивание инфры и помогать в ее разворачивании;
- Проектировать/участвовать в проектировании архитектуры ML-продуктов и сервисов.

В перспективе при получении инвестиционного транша на запуск продуктов, увеличении команды и фокусировке на конкретных продуктах можно будет выделить для себя более узкую область для профессионального роста.

Что классного в вакансии:
- Greenfield - никакого legacy, выбор технологий в первую очередь исходя из технологических и бизнес-соображений;
- Быстрый фидбек - либо продолжаем работу над PoC/MVP, либо переходим к следующей гипотезе из бэклога;
- Возможность проявить себя в решении задач на разные типы алгоритмов;
- Возможность присоединиться к команде запуска стартапа внутри стартапа на самой ранней стадии - стать первым инженером в команде;
- Возможность работать над решениями для глобального рынка;
- Возможность напрямую влиять на запуск и рост бизнеса.

Стек
- Пишем на Python;
- Текущие данные хранятся в Postgres, ClickHouse;
- Есть возможность использовать несколько облаков и другие решения;
- Прототипируем в Jupyter;
- Для переноса в прод можем использовать Flask, StreamLit, Airflow, Kafka, Kubernetes и т.д.;
- Изменение и расширение стека может быть одним из артефактов деятельности кандидата.

Требования к кандидату
- совокупный опыт работы в ML/DS/AI от 3 лет;
- уверенное владение Python и SQL;
- насмотренность в разных областях ML;
- опыт в классическом ML, в том числе, работа с транзакционными данными и Time-Series;
- опыт с рекомендашками, особенно для ритейла;
- опыт с NLP;
- опыт использования LLM для не-английского языка будет большим плюсом;
- понимание CI/CD, MLOps, готовность выстраивать инфру с нуля или принять участие в проектировании архитектуры и постановке задачи на DevOps;
- опыт полного цикла внедрения моделей обязателен;
- умение коммуникации с бизнесом внутри команды и со смежными командами (как бизнес, так и разработка, девопс и т.д.);
- самостоятельность, инициативность и умение декомпозировать при решении задач.

Продолжение и ответы на 10 вопросов в 1-м комментарии 👇

Нескучный Data Science Jobs

29 Sep, 10:38


Data Weekend offer от Авито

🤔 Если вы хотели пособеседоваться в Авито и не хотите потратить на это неделю+, то держите отличный шанс получить оффер всего за два дня.

Этапы отбора:
1. Подайте заявку до 1 октября
2. Решите тест
3. Пройдите интервью 5-6 октября

Откликайтесь и забирайте оффер!

Нескучный Data Science Jobs

20 Sep, 12:53


Позиция: Аналитик-разработчик
Куда: Купер (ех СберМаркет)
Формат работы: Полная занятость. Полная удаленка, есть возможность работы из офиса в Москве, м. Новокузнецкая
Вилка (gross): 250-350к gross

Про команду: DS-команда краткосрочной эффективности операций - создает и развивает технологии баланса спроса и предложения в сервисе (технологии мы называем сокращенно сурж). У нас уже есть написанный сервис для плановой доставки, который позволяет нам в онлайне управлять доступностью слотов для доставки, при этом есть много гипотез, которые мы хотим внедрить в алгоритм.

Что предстоит делать:
- Улучшить текущий алгоритм суржа в плановой доставке
- Разработать и внедрить сурж слотов в быстрой доставке
- Находить точки роста в сурж-сервисах
- Разрабатывать новые решения для регулирования спроса

Что классного в вакансии:
- мы делаем алгоритмические решения для операций, а операции - сердце бизнеса Купера
- у нас нет работы в стол: мы быстро проверяем гипотезы и либо развиваем сервис, либо не работает впустую
- мы даем много творческой свободы: для нас важно найти решение бизнес-проблем

Стек
- Пишем на Python и SQL;
- Данные храним в ClickHouse, S3;
- Прототипируем в Jupyter, успешные эксперименты переносим на Airflow + Kubernetes;

Требования к кандидату
- совокупный опыт работы в дата-аналитике/продуктовой аналитике/ds от 2 лет
- уверенное владение Python и SQL;
- Git, Bash, Docker, Gitlab CI
- опыт полного цикла внедрения моделей или аналитико-разработческих систем (сбор данных, обучение и оценка модели/написание алгоритма, проведение А/Б-тестов, выкатка в прод);
- самостоятельность, инициативность и умение декомпозировать при решении задач.

Ответы на 10 важных вопросов:
1.Данные: собираем данные как в клиентской части (заказы, детализация заказов, логи в приложении), так и в курьерской части (выполенные заказы, выбранные смены, логи курьерского приложения)
2.Железо: Для работы - Macbook. ML ресурсы нашей компании находятся в Yandex.Cloud, группе ML предоставляются виртуальные машины с GPU A100/V100, ноды с GPU в клаудных кубернетисах для прогона дагов, и еще большой список нод для иной нагрузки, не вовлекающей ГПУ, такой как Trino, Airflow, прогона кастомного кода.
3.Масштаб влияния на core-бизнес? Осень-зима - самый активный период бизнеса Купера; технологии, которые разрабатывает команда ML-операций, поддерживают качество и эффективность сервиса, мы напрямую влияем на бизнес.
4.Уровень развития Data Science в компании? Data Science является ключевым направлением развития компании, команда проникла во все домены бизнеса, сейчас есть 6 команд, создающие решения для своего домен: операции, поиск, рекомендательные системы, маркетинг, контент и ads-платформа. Есть отдельная команда MLOps, развивающая платформу длдя удобной работы.
5.Роль дата сайентиста: DS в команде делает работу полного цикла: от исследования идея до выкатки в продакшн.
6.Бэкграунд у вашего руководителя? linkedin
7.Как часто вам будут мешать работать? 2-5 часов организационных встреч в неделю: командные процессы (дейли, планирования, ретро, грумминги) + синки с продуктом и вертикалью операций
8.Карьерный рост: перфоманс ревью 2 раза в год
9.Prod/Research: 50/50, поэтому позиция - аналитик-разработчик: мы ожидаем, что будут и вопросы для изучения и продумывания, также и реализация в продакшне.
10.Функция сервиса или лидера? 60/40 в сторону лидера, задачи, которые предлагаем на этой позиции, не решались, их нужно придумать и реализовать, и мы ждём самостоятельности и инициативности.
Направляйте ваши резюме ✈️@daria_lagodyuk

Нескучный Data Science Jobs

16 Sep, 10:13


Позиция: Senior Data Analyst
Куда? Хантфлоу, Data Science команда.
Формат работы: Удаленно в РФ или Москва (с возможностью посещать офис, м. Дмитровская). Возможно оформление не в РФ с работой по всему миру.
Вилка (на руки): 250-400 тыс. руб. (или эквивалент в евро)

Описание вакансии

Хантфлоу — компания в области HRTech, предоставляющая передовые решения для автоматизации рекрутинга. Наш продукт помогает компаниям эффективно закрывать вакансии, сокращая время на поиск и отбор кандидатов. Подробнее о компании вы можете узнать на сайте.
Сейчас мы стремимся развивать аналитическое направление и ищем опытного Senior Data Analyst, который станет первым аналитиком в компании и поможет заложить основы этой функции.
Основной спектр задач аналитического направления будет включать:

- Задачи от бизнес-юнитов компании: автоматизация расчета метрик, построение дашбордов, формирование и проверка гипотез по улучшению бизнес-процессов.
- “Внутренние” задачи в команде Data Science: проведение А/Б тестов, мониторинг моделей.

Кроме непосредственного решения задач, Вы также будете играть важную роль в оценке необходимости дополнительных ресурсов, включая потенциальный найм новых аналитиков и выделение роли Data Engineer. На этой роли возможен постепенный рост в руководителя аналитики.

Что нужно делать?

- Создавать и развивать интерактивные дашборды для мониторинга ключевых показателей бизнеса.
- Взаимодействовать с бизнес-заказчиками: совместно разрабатывать гипотезы, формулировать задачи и анализировать результаты.
- Презентовать аналитические выводы и рекомендации бизнес-заказчикам, обеспечивая их понимание и внедрение.
- Налаживать ETL-пайплайны, необходимые для решения аналитических задач.
- Формировать и продвигать аналитическую культуру в компании, обучая коллег и внедряя лучшие практики.


Требования

- Опыт работы в качестве Data Analyst не менее 4 лет.
- Подтвержденный успешный опыт внедрения аналитических решений и их влияния на бизнес-результаты.
- Технологический стек: Python (sklearn, pandas, numpy), SQL, Git, Docker, Airflow.
- Опыт работы с инструментами визуализации данных (Tableau/Power BI/DataLens/Superset)
- Опыт создания и внедрения интерактивных дашбордов.
- Опыт разработки и оптимизации ETL-пайплайнов.

Условия:
- Рабочий mac
- Профессиональное обучение и повышение квалификации за счет компании
- Расширенная программа ДМС со стоматологией, вызовом врача на дома и полисом путешественника — после испытательного срока
- Ежемесячная компенсация оплаты интернета при работе из дома, или проезда при работе из офиса
- 12 дней «без больничного» в год.


Ответы на 10 важных вопросов:
1. Данные:
- Более 40 млн кандидатов в базе
- Более 100 тыс. вакансий
- Более 300 млн действий по кандидатам
- 8 лет истории
2. Железо:
- Рабочий MacBook Pro
- Аренда облачных серверов с GPU
3. Масштаб влияния:
Для компании Data Science — «The Next Big Thing» и ключевое направление в развитии компании. Есть возможность сыграть ключевую роль в становлении аналитической функции.
4. Уровень развития Data Science в компании:
В плане аналитики — чистое поле. Роль подразумевает зарождение аналитической функции.
5. Чем занимаются дата сайентисты в компании:
Дата аналитиков сейчас в команде нет, ожидаются те функции, что описаны в вакансии.
6. Какой бэкграунд у вашего потенциального руководителя:
linkedin (https://www.linkedin.com/in/koptelov-dmitrii/)
7. Как часто вам будут мешать работать:
1 час еженедельного синка по задачам
8. Карьерный рост:
На этой роли возможен рост в руководителя аналитики
9. Research/Prod: Prod
10. Функция сервиса или лидера?
в большей степени функция лидера

✉️ Резюме отправляйте на почту: [email protected]
✈️ По вопросам в тг: @meacca

Нескучный Data Science Jobs

06 Sep, 17:57


🎫 AI Conf. Розыгрыш офлайн-билета + промокод

🎙 AI Conf пройдет уже 27-28 сентября в Москве в Старт Хабе. Программный комитет конференции уже отобрал порядка 50 лучших докладов. Наша команда расскажет про рецепт приготовления табличной нейронки и применение AutoML и AutoDL сервисов на практике.

🎁 Принес два подарка для подписчиков канала Нескучный Data Science:
1️⃣ Промокод friends, который дает скидку 15% на онлайн и офлайн билеты
2️⃣ Розыгрыш одного бесплатного офлайн-билета стоимость 75к рублей

Как выиграть билет на офлайн часть?
1️⃣ Указать в комментариях в канале @not_boring_ds к этому посту название наиболее заинтересовавшего вас доклада
2️⃣ Подписаться на каналы @not_boring_ds, @not_boring_ds_jobs и @UseDataConfChannel
3️⃣ Прокачать удачу таким образом чтобы генератор случайных чисел выбрал именно вас.

🗓 Подведем итоги в пятницу 13 сентября. 🙏 Желаю удачи!

Нескучный Data Science Jobs

05 Sep, 15:50


Позиция: Middle+ Data Scientist
Куда? Альфа-Банк, Департамент продвинутой аналитики, xaб Розничный бизнес
Формат работы: Гибрид - Москва, м. Технопарк + удаленно.
Вилка гросс: 350-450K + ежеквартальный бонус ~ 15% (от дохода за квартал).

Что нужно делать?
Поддержка моделей в проекте категорийный кэшбэк
Разработка новых моделей (прогноз трат в категориях, интерес клиентов, оптимизатор выбора категорий, модель эластичности бюджета и растранзачивания и др). Табличные данные.
Вывод моделей в продакшн
Развивать и поддерживать внутренний фреймворк для разработки моделей.
Общаться с product owner’ами и выявлять потребности бизнеса
Проводить пилоты гипотез

Требования:
1. Общий опыт работы в этом направлении – от 3 лет.
2. Hard skills: Python, bash, git, SQL, Hadoop; BitBucket (Git), AirFlow, MLFlow.
3. Умение выбирать метрику под бизнес-задачу
4. Опыт написания кода в прод
5. Опыт проведение АБ тестов


Ответы на 10 важных вопросов:
1. Данные: Обычно - Hadoop (все данные Альфа-Банка) + внешние источники по API. Часть данных может быть в Oracle
2. Железо: kuber до 64 ядер + 512 ГБ оперативы. Хадуп - 6TB, 1000+ ядер. Продакшн: cистема исполнения моделей + команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес?
Модели - ядро большинства банковских процессов, в частности, категорийный кэшбэк- один самых значимых проектов, с ежемесячной отдачей клиентов.
4. Уровень развития Data Science в компании? се линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль дата сайентиста: ДС-ы участвуют в постановке задачи, совместно с бизнесом генерят идеи развитии. ДС ответственен за исполнение модели в проде и аналитику проводимых пилотов.
6. Бэкграунд у вашего руководителя? LinkedIn
7. Как часто вам будут мешать работать? Daily meetings + 1-2 статус встречи с бизнесом
8. Карьерный рост: формализована матрица компетенций. Ежеквартально происходят «круглые столы» с пересмотром и защитой
9. Prod/Research: Prod 90%
10. Функция сервиса или лидера? На данном этапе требуется больше сервисных функции

Присылать резюме на [email protected] с темой письма: «Резюме DataScientist".

Нескучный Data Science Jobs

03 Sep, 12:50


Позиция: Middle+
Куда? Space International/ TBC Uzbekistan Credit Risk Team
Формат работы: удаленно, по желанию можно в Тбилиси или Ташкент
Вилка гросс: 2800 - 4000 usd + ежегодный бонус ~ 140% (от заработной платы ).

Что нужно делать?
• Разрабатывать и поддерживать модели кредитного риска для кредитования розничного бизнеса (PD, Income Estimation, components of NPV, Soft collection, preapproval, antifraud).
• Развивать и поддерживать внутренний фреймворк для разработки моделей, эксперименты всегда приветствуются.
• Генерировать и применять в моделях новые фичи ( богатые мобильные данные, транзакции всех банков Open banking).
• Анализировать эффективность новых источников данных и применять их в моделях.

Требования:
• Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов.
• Работать вплотную с командами риск менеджеров, Mlops, Data architects, Devops
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.
• Опыт в разработке моделей машинного обучения от 3 ех лет.
• Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc).
• Работа в кредитных рисках банков и финтех организации будет огромным преимуществом.
• Знание русского и английского языка обязательно.

Ответы на 10 важных вопросов:
1. Данные: Много различных сорсов, основное преимущество транзакции благодаря Open banking в Узбекистане. Данные хорошего качества, деревья и IV работают.
2. Железо: Разработка моделей: сейчас на собственных ресурсах,в пилоте Databricks и Jupyter hub
Продакшн: cистема исполнения моделей + команда MLOps. Для работы: ноутбук.
3. Масштаб влияния на core-бизнес?
Одна из важнейших в стратегии
принятия решений, утверждение модели рассматривается на высшем уровне.
4. Уровень развития Data Science в компании? Модели первично внедрены во все процесс РМ.
5. Роль дата сайентиста: ДС-ы участвуют в постановке задачи, совместно с командой рисков, прорабатывают генерацию фичей на условно подготовленных данных, обучают и документируют модель, подготавливают код для внедрения в прод, выполняют функцию аналитического сопровождения моделей после внедрения в прод.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? Daily meetings + 1 weekly совместно с CRO
8. Карьерный рост: рассматривается индивидуально .
9. Prod/Research: Prod. От моделей требуется польза и эффективность.
10. Функция сервиса или лидера? На данном этапе требуется больше сервисных функции, нестандартных предложений и быстрых решений.

Резюме напралять 📨 [email protected]

Нескучный Data Science Jobs

02 Sep, 11:23


Позиция: Middle/Senior NLP Engineer
Куда: Альфа-Банк, Лаборатория машинного обучения
Формат работы: полная занятость; офис в Москве; на данной позиции возможна полная удаленка
Вилка гросс:
Middle: 240-360k + ежеквартальная премия (~15% от дохода за квартал)
Senior: 360-460k + ежеквартальная премия (~15% от дохода за квартал)

Про нас:
Автоматизируем обработку обращений клиентов с помощью чат-ботов и голосовых ассистентов. Наши модели снижают рутину в работе операторов и ускоряют решение запросов пользователей. Мы решаем широкий спектр задач в области NLP: от поиска инсайтов в обратной связи клиентов до автоматизации контроля качества контактного центра.
Команда приступает к следующему этапу развития через развитие экспертизы в LLM, чем и предстоит заниматься в рамках этой вакансии.

Тебе предстоит:
- Строить RAG-пайплайны для обслуживания сотрудников и клиентов Альфы
- Дообучать LLM на банковском домене данных
- Развивать retriever, улучшать поиск
- Улучшать качество и эффективность моделей ассистента оператора
- Использовать LLM для автоматизации процессов разметки данных

Требования:
- Опыт работы в области машинного обучения и NLP (3+ лет для Senior)
- Знание, понимание архитектур и опыт работы с моделями, такими как GPT, BERT и другими
- Уверенные знания Python и библиотек для машинного обучения (TensorFlow, PyTorch, transformers…)
- Знание основ работы с большими данными и опытом их обработки (Spark, Hadoop)
- Высшее образование в области компьютерных наук, математики или смежных дисциплин
- Английский язык на уровне чтения технической документации

Будет плюсом:
- Опыт работы с RAG пайплайнами и LLM моделями (LLaMA, GPT, Mistral…)
- Опыт работы с облачными платформами (в идеале Яндекс.Облако)
- Успешный соревновательный опыт

Ответы на 10 важных вопросов в оригинальной статье.

Резюме направляйте на почту [email protected] с темой «NLP Engineer лабораторию»

Нескучный Data Science Jobs

19 Aug, 09:18


Позиция: Middle Data Scientist
Куда? МКБ, валидация
Формат работы: Гибрид: Москва, Москва-Сити + удаленно.
Вилка гросс: 200-300k + годовой бонус ~ 15% (от дохода за год).

Что нужно делать?
1. Валидация различных моделей (рисковые PD модели, а также бизнесовые модели, например, модель дохода клиента, модель оттока клиентов, модель утилизации лимитов и прочие), в том числе: - Формирование выборки и оценка качества данных для проведения валидации; - Качественный и количественный анализ: оценка дискриминационной способности, корреляционный и дисперсионный анализ, анализ документации, тестирование реализации модели в конвейере и др; - Проведение альтернативного моделирования;
2. Оптимизация и автоматизация процедур внутри отдела. Усовершенствование внутренних библиотек по автовалидации и альтернативному моделированию.

Требования:
• Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков).
• Навыки написания SQL-запросов (оптимизация скриптов, оконные функции, объединение, агрегация, создание и изменение объектов).
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.
• Опыт в разработке/валидации моделей машинного обучения от 1 года.
• Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc).
• Опыт работы с git.
• Понимание основ риск-менеджмента является преимуществом.
• Умение работать с MLOps (Airflow, MLflow, Seldon) является преимуществом.

Ответы на 10 важных вопросов:
1. Данные: SQL (Oracle, Vertica) + внешние источники. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: JupyterHub на kubernetes с возможностью выделения до 32 ядер + 128 ГБ оперативной памяти. Продакшн: cистема исполнения моделей + выделенная команда MLOps. Для работы: выделение ноутбука (8 ядер + 32 ГБ оперативной памяти) + удалённое рабочее место (VDI).
3. Масштаб влияния на core-бизнес? Без валидации ни одна модель не может быть введена в эксплуатацию + возможность альтернативным моделированием улучшить модель разработчика (фактически ваша модель пойдет в пром.)
4. Уровень развития Data Science в компании? Почти все линии бизнеса покрыты ML моделями. Каждый год увеличивается количество моделей (+10-20 шт.) и их сложность (до бустингов и нейронных сетей).
5. Роль дата сайентиста: ДС-ы проводят полную валидацию модели и альтернативное моделирование, качественную и количественную валидацию. Есть собственные библиотеки, покрывающие методику валидации, альтернативное моделирование и создание отчета о валидации в Python. Также осуществляется перевод имеющихся моделей и библиотек на MLOps и создание Dashboard’а по мониторингу моделей.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 1-2 часа организационных встреч в неделю.
8. Карьерный рост: Ежегодное ревью.
9. Prod/Research: Prod, но при обоснованном желании можно позаниматься и Research’ем. Последний Research, проведенный командой, является анализ финансовой оценки изменения Gini при изменении модели.
10. Функция сервиса или лидера? На данном этапе сервисных функций больше.

Ваши резюме направлять 📧 [email protected] ✈️ @igorigg

Нескучный Data Science Jobs

13 Aug, 09:50


Позиция: Аналитик-разработчик
Куда: Купер (ех СберМаркет)
Формат работы: Полная занятость. Полная удаленка, есть возможность работы из офиса в Москве, м. Новокузнецкая
Вилка (gross): 250-350к gross

Про команду: DS-команда краткосрочной эффективности операций - создавает и развивает технологии баланса спроса и предложения в сервисе (технологии мы называем сокращенно сурж). У нас уже есть написанный сервис для плановой доставки, который позволяет нам в онлайне управлять доступностью слотов для доставки, при этом есть много гипотез, которые мы хотим внедрить в алгоритм.

Что предстоит делать:
- Улучшить текущий алгоритм суржа в плановой доставке
- Разработать и внедрить сурдж слотов в быстрой доставке
- Находить точки роста в сурж-сервисах
- Разрабатывать новые решения для регулирования спроса

Что классного в вакансии:
- мы делаем алгоритмические решения для операций, а операции - сердце бизнеса Купера
- у нас нет работы в стол: мы быстро проверяем гипотезы и либо развиваем сервис, либо не работает впустую
- мы даем много творческой свободы: для нас важно найти решение бизнес-проблем

Стек
- Пишем на Python и SQL;
- Данные храним в ClickHouse, S3;
- Прототипируем в Jupyter, успешные эксперименты переносим на Airflow + Kubernetes;

Требования к кандидату
- совокупный опыт работы в дата-аналитике/продуктовой аналитике/ds от 2 лет
- уверенное владение Python и SQL;
- Git, Bash, Docker, Gitlab CI
- опыт полного цикла внедрения моделей или аналитико-разработческих систем (сбор данных, обучение и оценка модели/написание алгоритма, проведение А/Б-тестов, выкатка в прод);
- самостоятельность, инициативность и умение декомпозировать при решении задач.

Ответы на 10 важных вопросов:
1.Данные: собираем данные как в клиентской части (заказы, детализация заказов, логи в приложении), так и в курьерской части (выполенные заказы, выбранные смены, логи курьерского приложения)
2.Железо: Для работы - Macbook. ML ресурсы нашей компании находятся в Yandex.Cloud, группе ML предоставляются виртуальные машины с GPU A100/V100, ноды с GPU в клаудных кубернетисах для прогона дагов, и еще большой список нод для иной нагрузки, не вовлекающей ГПУ, такой как Trino, Airflow, прогона кастомного кода.
3.Масштаб влияния на core-бизнес? Осень-зима - самый активный период бизнеса Купера; технологии, которые разрабатывает команда ML-операций, поддерживают качество и эффективность сервиса, мы напрямую влияем на бизнес.
4.Уровень развития Data Science в компании? Data Science является ключевым направлением развития компании, команда проникла во все домены бизнеса, сейчас есть 6 команд, создающие решения для своего домен: операции, поиск, рекомендательные системы, маркетинг, контент и ads-платформа. Есть отдельная команда MLOps, развивающая платформу длдя удобной работы.
5.Роль дата сайентиста: DS в команде делает работу полного цикла: от исследования идея до выкатки в продакшн.
6.Бэкграунд у вашего руководителя? linkedin
7.Как часто вам будут мешать работать? 2-5 часов организационных встреч в неделю: командные процессы (дейли, планирования, ретро, грумминги) + синки с продуктом и вертикалью операций
8.Карьерный рост: перфоманс ревью 2 раза в год
9.Prod/Research: 50/50, поэтому позиция - аналитик-разработчик: мы ожидаем, что будут и вопросы для изучения и продумывания, также и реализация в продакшне.
10.Функция сервиса или лидера? 60/40 в сторону лидера, задачи, которые предлагаем на этой позиции, не решались, их нужно придумать и реализовать, и мы ждём самостоятельности и инициативности.

Направляйте ваши резюме ✈️@daria_lagodyuk

Нескучный Data Science Jobs

12 Aug, 14:20


📣 Ищем к себе в Лабораторию стажера 🅰️

Позиция: Стажер DS

Куда? Альфа-Банк, Лаборатория машинного обучения, Монетизация нейронных сетей.

Формат работы: Москва, м. Технопарк. Возможна полная удаленка.

Вилка (gross): 60K, при успешной стажировке переход на позицию Junior DS: 120-240K + ежеквартальная премия (~15% от дохода за квартал)

Что предстоит делать на этой позиции?
Под руководством ментора разрабатывать и внедрять ML модели для улучшения процессов привлечения новых клиентов. Модели охватывают широкий спектр задач: предсказание склонности и одобрения, прогнозирование доходности, предсказание оттока/фрода и другие. В рамках стажировки предстоит не только писать код, но и плотно взаимодействовать с заказчиками, проводить A/B тестирование моделей, погружаться в бизнес-процессы банка.

Что ожидаем от кандидата:
• Опыт работы с классическим ML и DL (учебные проекты / соревнования);
• Технологический стек: python + pytorch, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git;
• Понимание основных принципов и алгоритмов классического ML и DL;
• Умение выбирать метрику под бизнес-задачу;
• Навык работы с инструментами Spark, Hadoop, Hive - как преимущество.

Будет большим плюсом:
- Призовые места на соревнованиях;
- Опыт решения ML-задач на графах.

Ответы на 10 важных вопросов:
На 9/10 важных вопросов есть ответы в оригинальной статье.

Руководитель:
Бэкграунд руководителя: linkedin

Присылайте резюме на почту [email protected] с темой "Стажер в Лабораторию" / в ТГ @nickimpark

Нескучный Data Science Jobs

06 Aug, 08:33


📣 Ищем к себе в 🅰️ Лабораторию стажера на NLP направление

Позиция: Стажер (NLP)
Куда: Альфа-Банк, Лаборатория машинного обучения, NLP отдел
Формат работы: Полная занятость на период стажировки (4-6 месяцев). Полная удаленка, есть возможность работы из офиса в Москве, м. Технопарк
Вилка (gross): 60k, при успешном прохождении стажировки переход на Junior: 120-240k + ежеквартальная премия ~ 15% (от дохода за квартал)

Про команду:
Помогаем автоматически обрабатывать обращения клиентов за счет моделей для ботов в чате и голосовом канале. Снижаем рутину в работе оператора благодаря моделям для ассистента оператора и автоматической классификации обращений клиентов. Покрываем широкий класс NLP-задач: поиск инсайтов в обратной связи клиентов, классификация новостей с целью выявления событий комплаенс контроля, автоматизация обращений сотрудников в техподдержку, выявления алертов в качестве обслуживания, автоматизация контроля качества контактного центра и множество других задач. Про нас можно почитать, например, тут, а также на хабре. Подробнее про часть задач можно узнать в нашем ODS-треке NLP in Practice.

Что предстоит делать:
- Улучшать действующие модели в непрерывном цикле, состоящем из поиска инсайтов->разметки->моделирования
- Дообучать LM на банковском домене данных
- Улучшать качество, эффективность и уровень автоматизации моделей классификации обращений
- Разрабатывать модели для развития сервисных процессов

Ожидаем от кандидата:
- Опыт работы с классическим ML и DL (учебные проекты/соревнования);
- Технологический стек: python, LightGBM/XGBoost/CatBoost, numpy, pandas, scikit-learn, pytorch, SQL (знание hive/impala/spark будет плюсом), git.
- Понимание основных принципов и алгоритмов классического ML и DL;
- Умение выбирать метрику под бизнес-задачу

Ответы на 10 важных вопросов в оригинальной статье

Присылайте резюме на почту ✉️[email protected] с темой «Стажер NLP в Лабораторию».

Нескучный Data Science Jobs

30 Jul, 13:12


Позиция: Разработчик NLP (Middle/Senior)
Куда: Альфа-Банк, Лаборатория Машинного Обучения, отдел NLP
Формат работы: Полная занятость. Удаленная работа или возможность работы из офиса в Москве
Вилка гросс: Middle: 260-360K, Senior: 360-460K + ежеквартальный бонус ~ 15% (от дохода за квартал)

Про нас:
Мы помогаем автоматически обрабатывать обращения клиентов за счет моделей для ботов в чате и голосовом канале. Снижаем рутину в работе оператора благодаря моделям для ассистента оператора и автоматической классификации обращений клиентов на 1000+ классов.
Покрываем широкий спектр NLP-задач: поиск инсайтов в обратной связи клиентов, классификация новостей с целью выявления событий комплаенс контроля, автоматизация обращений сотрудников в helpdesk, выявление алертов в качестве обслуживания, автоматизация контроля качества контактного центра и многие другие NLP-задачи. Команда приступает к следующему этапу развития через развитие экспертизы в LLM. Подробнее про часть задач можно узнать в треке NLP in Practice.

Тебе предстоит:
- Улучшать действующие модели в непрерывном цикле, состоящем из поиска инсайтов -> разметки -> моделирования -> А/Б-тестирования.
- Строить RAG-пайплайны для обслуживания сотрудников и клиентов Альфы.
- Дообучать LLM на банковском домене данных.
- Улучшать качество и эффективность моделей ассистента оператора.
- Использовать LLM для автоматизации процессов разметки данных.
- Развивать комплекс моделей для улучшения качества работы операторов и менеджеров в отделениях (контроль качества, суммаризация диалогов, семантический поиск, выявление инсайтов).

Требования:
- Опыт работы в области машинного обучения и NLP от 2 лет (Middle) / от 5 лет (Senior).
- Знание и опыт работы с языковыми моделями, такими как GPT, BERT и другими.
- Уверенные знания Python и библиотек для машинного обучения (TensorFlow, PyTorch).
- Опыт работы с библиотеками для NLP (transformers, torch).
- Знание основ работы с большими данными и опытом их обработки.
- Высшее образование в области компьютерных наук, математики или смежных дисциплин.
- Английский язык на уровне чтения технической документации.

Будет плюсом:
- Опыт работы с RAG (Retrieval-Augmented Generation) пайплайнами.
- Опыт работы с облачными платформами (AWS, Google Cloud, Azure, Датасфера).

Ответы на 10 важных вопросов в оригинальной статье.

Резюме направляйте на почту ✉️[email protected] с темой «Разработчик в лабораторию»

Нескучный Data Science Jobs

23 Jul, 16:02


Десять важных вопросов перед трудоустройством в Data Science

🤔 Пока вы работаете в найме, вопрос построения карьерного пути остается актуальным. Не рассматриваете предложение по работе прямо сейчас? Представьте, что вам предложат лучшие условия труда, которые будут включать не только увеличение дохода в X раз, но также интересные задачи и подходящую вам рабочую атмосферу. К такому предложения, как показал опрос на Reliable ML на Data Fest 2024, сложно остаться индифферентным.

⌛️ За полтора года с момента выхода одноименной статьи, мое виденье процесса построения карьеры немного изменилось и дополнилось. Во-первых, предлагаю рассматривать ваш текущий опыт в качестве капитала и относится к выбору работы, как к инвестиции. Во-вторых, визуальный материал удалось дополнить новыми мемами.

🧠 Призываю вас забывать, что вы эксперт в Data Science, и принимать решения на основе данных в повседневной жизни. Другими словами, тщательно собирайте и анализируйте доступные данные о компании и вашем будущем руководителе, которые вы сможете найти в самой вакансии и открытых источниках, в первую очередь, на linkedin. Конечно, вакансии с ответами на все вопросы вы сможете по традиции найти в @not_boring_ds_jobs.

📹 Смотрите запись выступления по ссылке

👉 За слайдами и обсуждением доклада переходите в канал Reliable ML.