Многие, особенно студенты или начинающие специалисты, спрашивают меня, в каком направлении лучше развиваться. За последний год, наблюдая за рынком, я выделил несколько ключевых направлений, где у нас не хватает сильных специалистов.
1️⃣ Дата инжиниринг
Хорошие специалисты здесь есть, но их очень мало. Дата-инжиниринг требует инженерного подхода, так как это разработка в сфере данных. Помимо знаний баз данных и SQL, важно архитектурное мышление, знание систем для работы с биг-дата (Hadoop, Spark, Kafka и др.) и умение работать с распределёнными системами. Полезно владеть одним языком программирования (например, Python, Java или Scala). Развитие в этой области всегда перспективно: объём данных растёт, и инфраструктура, созданная дата-инженерами, обеспечивает работу других специалистов.
2️⃣ Ops (Operations)
Эта область, особенно MLOps и DataOps, у нас пока новая. Но такие специалисты со временем будут очень востребованы. Уже сейчас зарплаты на MLOps позиции довольно высокие! Эти ребята отвечают за инфраструктуру. Пока их задачи часто выполняют дата-инженеры или ML-инженеры, но не всегда с тем качеством, как это делают профильные спецы. Они отвечают за стабильность инфраструктуры, её надёжность и масштабируемость.
Раньше, когда я строил модели, всё сам тянул на продакшен, а потом каждые 1-2 месяца заново их переобучивал. Когда начал работать с MLOps-специалистом, всё заиграло новыми красками. Он многое мне открыл: сам качественно отправлял модели на прод, модели автоматически переобучались, и мы смогли справиться с Data Drift (тогда я ещё даже не знал, что это такое). Короче, OPS-ерам огромный респект, смело двигайтесь в эту область!
3️⃣ Продуктовая аналитика
В целом, у нас пока нет культуры продуктовой аналитики. Но она со временем появится, особенно когда будет развиваться культура данных и инфраструктуры, а также станет больше толковых тех продукт-менеджеров и CPO. Потому что профессия опирается на два стула — данные и продукт.
Культуры A/B тестирования тоже пока нет (ни в одной компании нет собственной платформы для A/B тестов), но я вижу, что многие PM/CPO и аналитики хотят развивать это направление. Без знаний и опыта здесь не обойтись, об этом позже) Верю, что в ближайшее время у нас станет больше грамотных аналитиков, так что направление очень перспективное.
4️⃣ DS/ML/DL
У нас действительно много хороших специалистов, просто хочу выделить несколько областей.
Мне очень интересно следить за развитием рекомендательных систем, и иногда сам в них разбираюсь. Но почему-то у нас они не особо популярны — нет продуктов, где рекомендации работали бы на уровне. Когда я искал спеца по рекомендациям, оказалось, что таких вообще нет. Есть ML-специалисты, которые работают над другими проектами, но иногда берут какие-то опенсорсные библиотеки и адаптируют их для рекомендаций. А вот тех, кто бы этим серьёзно занимался, у нас нет.
Ещё мало специалистов, кто глубоко работает с временными рядами (Time Series Models). И, конечно, не хватает экспертов по большим языковым моделям (LLM). Эти модели будут дальше развиваться, и в будущем важно уметь с ними работать, интегрировать, дообучать и настраивать под свои задачи. Эти специалисты, скорее всего, будут работать с ИИ-агентами, и там точно море интересных задач!
Khan of data & analytics