Data Science | Machinelearning [ru] @devsp Channel on Telegram

Data Science | Machinelearning [ru]

@devsp


Статьи на тему data science, machine learning, big data, python, математика, нейронные сети, искусственный интеллект (artificial intelligence)

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cGhHpZ

Data Science | Machinelearning (ru)

Добро пожаловать в Telegram канал под названием 'Data Science | Machinelearning'. Здесь вы найдете множество статей на тему data science, machine learning, big data, python, математика, нейронные сети и искусственный интеллект (artificial intelligence). Если вас интересует развитие в этих областях или вы просто хотите быть в курсе последних тенденций и новостей, то этот канал именно для вас. Здесь вы сможете узнать о самых актуальных методах и инструментах, которые помогут вам стать профессионалом в области анализа данных и машинного обучения. На канале 'Data Science | Machinelearning' вы найдете не только теоретические материалы, но и практические примеры и кейсы из реальной жизни, которые помогут вам лучше понять и применить полученные знания. Если у вас возникли вопросы по рекламе или разработке, вы всегда можете обратиться к @g_abashkin. Присоединяйтесь к нашему каналу и окунитесь в увлекательный мир data science и машинного обучения!

Data Science | Machinelearning [ru]

27 Jan, 10:07


⚙️ Оптимизация Trellis: запускаем генерацию 3D моделей на GPU с 8ГБ памяти

В статье рассказано, как с помощью оптимизации Trellis удалось снизить требования к видеопамяти с 16GB до 8GB, сохранив качество. Рассмотрены подходы к сжатию данных, переработке структур и повышению доступности инструмента.

Читать...

Data Science | Machinelearning [ru]

26 Jan, 18:07


🔥 Самые интересные статьи за последние дни:

• Реализация подобия Apple Vision Pro

• Почему LLM так плохо играют в шахматы (и что с этим делать)

• LLM будут врать вечно

• Как мы создали LLM-модель Cotype Nano

• Человек и LLM: как построить метрики для оценки моделей

Data Science | Machinelearning [ru]

26 Jan, 10:07


🤖 Псст, ИИ нужен? 5 полезных инструментов для разработчика

Статья предлагает подборку инструментов, платформ и шаблонов для работы с языковыми моделями и создания ИИ-ассистентов. Рассматриваются протестированные в МТС решения, упрощающие разработку и интеграцию.

Читать...

Data Science | Machinelearning [ru]

26 Jan, 07:07


Курс: NLP / Natural Language Processing https://otus.pw/XGJt/

Стань востребованным специалистом в области NLP и получи конкурентную профессию в IT.

Скидка 5% по промокоду: NLPJN

Старт занятий 29 января. Успей попасть в группу! https://otus.pw/XGJt/

Data Science | Machinelearning [ru]

25 Jan, 18:07


📖 «Охота на электроовец: большая книга искусственного интеллекта» или как написать книгу про ИИ без регистрации и SMS

История о том, как за 6 лет я написал двухтомник, посвящённый искусственному интеллекту и машинному обучению.

Читать...

Data Science | Machinelearning [ru]

25 Jan, 14:07


🌱 Никогда не прекращай быть «джуниором»

Считаешь, что знаешь всё о своём языке или технологии? Это первый шаг к застою.

👉 Совет: хотя бы раз в месяц изучай что-то новое — экспериментируй с языком, погружайся в новый инструмент или пробуй другой подход. В IT важно не только знать, но и уметь учиться. Это ключ к тому, чтобы оставаться востребованным.

Data Science | Machinelearning [ru]

25 Jan, 10:07


💳 Как мы провели ИИ-трансформацию стратегических процессов Сбера

Статья рассказывает об ИИ-трансформации Сбера, включая ключевые задачи, такие как стресс-тестирование, анализ рынков и прогнозирование эффективности сотрудников. Рассматривается использование ИИ до и после трансформации.

Читать...

Data Science | Machinelearning [ru]

25 Jan, 06:07


Как построить витрину данных, как в крупной IT-компании?

Объединение данных из разных источников — то, с чем в какой-то момент сталкиватся каждый аналитик или дата-инженер.

Представьте, что вы тренер футбольной команды. И у вас есть витрина данных, которая собирает информацию о каждом игроке, включая количество забитых голов, ассистов, время на поле и количество проведенных матчей. Такая витрина помогает выявить слабые места в команде и сфокусироваться на их улучшении.

Как строить витрину данных разберём в прямом эфире нашего бесплатного вебинара в режиме решения реальной рабочей задачи📊. Спикер вебинара — Айгуль Сибгатуллина, Data Engineer в Сбер.

Что будет на вебинаре:
• Построим воркфлоу от этапа получения ТЗ до создания полноценной витрины;
• Разберемся с методологией на разных диалектах;
• Узучим Spark в работе дата-инженера: преобразования, оптимизации, планы запросов;
• Используем AI для ускорения процессов.

🕗Встречаемся 28 января 19:00 по мск

Зарегистрироваться на бесплатный вебинар

Data Science | Machinelearning [ru]

24 Jan, 18:07


📝 Подборка вакансий для сеньоров

Data engineer
SQL, Python, Apache Hadoop
Уровень дохода не указан | от 3 лет

Data Engineer
SQL, Python, Apache Airflow, Greenplum, Apache Spark
от 250 000 ₽ | от 2 лет

Senior Data Scientist
Python
Уровень дохода не указан | опыт не указан

ML-инженер
Машинное обучение, Deep Learning, Нейронные сети, Python, TensorFlow, PyTorch, Keras, Linux, Git, Docker
Уровень дохода не указан | опыт не указан

Разработчик БД (PostgreSQL, прикладные витрины)
SQL, PostgreSQL, ETL, Apache Airflow, Greenplum
Уровень дохода не указан | от 3 лет

Data Science | Machinelearning [ru]

24 Jan, 10:07


⚙️ KAN 2.0: Kolmogorov-Arnold Networks Meet Science

Статья представляет перевод работы о нейронных сетях на основе алгоритма Колмогорова-Арнольда (KAN). Рассматриваются новые исследования, связь с наукой и использование библиотеки pykan на Python для практических задач.

Читать...

Data Science | Machinelearning [ru]

24 Jan, 06:07


Чем занимаются дата-сайентисты в Авито? Узнайте изнутри!

Статья от команды Data Science в Авито рассказывает о реальных кейсы, проектах и командах, которые развивают бизнес и обеспечивают безопасность платформы:

➡️ Как алгоритмы автомодерации проверяют миллионы объявлений.
➡️ Какие подходы используются для борьбы с мошенничеством.
➡️ Как работают персонализированные рекомендации и поиск.
➡️ Какие проекты ведет AI Lab в Авито.

Все о мире DS в Авито и многое другое ➡️ по ссылке.

Реклама. ООО «Авито Тех».

Data Science | Machinelearning [ru]

23 Jan, 18:07


📈 Подборка статей для вашей карьеры

• Больше чем книга

• Как поставить цель на обучение, чтобы дойти до конца

• Движение вверх: как стать CTO — на примере пяти историй ИТ-директоров

• Найм дизайнеров глазами лида

• Software Architect vs Solution Architect

Data Science | Machinelearning [ru]

23 Jan, 14:07


🎞 Как за 6 промтов к ChatGPT создать Python скрипт, скачивающий видео с YouTube для просмотра на телевизоре через Kodi

Статья рассказывает, как с помощью Python и ChatGPT создать скрипт для автоматической загрузки видео с YouTube и генерации метаданных (описаний и обложек) для интеграции с медиацентром Kodi.

Читать...

Data Science | Machinelearning [ru]

23 Jan, 10:07


🤔 Размер имеет значение: как исторические данные помогают на этапе дизайна A/B-теста

Статья изучает применение метода CUPED в A/B-тестах для повышения чувствительности и сокращения выборок. Рассматривается его использование на этапе дизайна эксперимента без потери статистической мощности.

Читать...

Data Science | Machinelearning [ru]

23 Jan, 06:07


Где взять ресурсы для обучения ML-моделей, ускорения сложных вычислений и анализа больших данных?

Все эти сложные задачи можно решить на серверах с GPU от Selectel. Выбирайте сервер с видеокартой под ваш запрос и запускайте его буквально за пару минут — не нужно тратиться на покупку оборудования, а все ресурсы GPU только ваши.

Преимущества аренды сервера с GPU в Selectel:

- Оптимальный сервер под ваши задачи. Выбирайте из десятка готовых конфигураций или соберите собственную с нужной видеокартой под ваши запросы и бюджет.
- Более 15 моделей видеокарт в наличии: от базовой GTX 1080 до профессиональных H100 и А100 (на 40 или 80 ГБ). Всегда есть ресурсы для масштабирования при росте вашего проекта.
- Выгодная аренда: оплата за фактически использованные ресурсы от 29 ₽/час и скидки до 44% на профессиональные видеокарты
- Безопасность хранения и обработки данных. Серверы соответствуют 152-ФЗ и «из коробки» имеют бесплатную защиту от DDoS-атак.

Арендуйте серверы с GPU: https://slc.tl/erxfo

Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzquiMtVH

Data Science | Machinelearning [ru]

22 Jan, 18:07


🤔 Прогнозирование продаж с использованием библиотеки Prophet

Статья посвящена прогнозированию продаж FTTB-FMC для ежедневной отчетности. Рассматриваются подходы к анализу данных, ключевые KPI и методы, используемые для прогнозирования продаж в сегменте ШПД и конвергентных продуктов.

Читать...

Data Science | Machinelearning [ru]

22 Jan, 10:07


⚙️ Как я учился писать промпты для RAG пайплайна. Разбор 3-го места на AI Journey 24 E-com AI assistant

Статья описывает опыт создания RAG-пайплайна с использованием Gigachat API для участия в AI Journey. Автор делится инсайтами, полученными в процессе разработки ассистента для рекомендаций товаров, который занял 3-е место.

Читать...

Data Science | Machinelearning [ru]

21 Jan, 18:07


📝 Подборка вакансий для мидлов

LLM Engineer
Проектирование и создание инфраструктуры для запуска ИИ-агентов, включая работу с RAG, tools, механизмами памяти
Уровень дохода не указан | Требуемый опыт не указан

Tech Lead Data Engineer
Oracle, Greenplum, ETL, DWH
до 430 000 ₽ | от 2 лет опыта

Бизнес-аналитик / Системный аналитик
BPMN, UML, Анализ данных, Разработка ТЗ
до 150 000 ₽ | Средний (Middle)

Data Science | Machinelearning [ru]

21 Jan, 10:07


⚙️ Как обеспечить Data Quality терабайтов данных и зачем: опыт СИБУРа

Статья посвящена опыту СИБУРа в создании DQ-сервиса для обеспечения качества данных. Рассматриваются задачи DQ, архитектура решения и универсальные подходы, применимые для анализа данных в крупных компаниях.

Читать...

Data Science | Machinelearning [ru]

20 Jan, 18:07


🔎 Подборка вакансий для джунов

Junior Data Analyst
🟢Python, SQL, ETL, Airbyte, dbt
🟢Уровень дохода не указан | Без опыта

Junior Data Scientist (A/B-testing)
🟢Python, Spark, Airflow, MLFlow, Postgres, Git, DVC, Docker
🟢Уровень дохода не указан | 1–3 года опыта

Младший Data engineer
🟢Python, SQL, Debezium, Airflow
🟢Уровень дохода не указан | 1–3 года опыта

Data Science | Machinelearning [ru]

20 Jan, 10:07


➡️ Семантическая сегментация: самый полный гайд

Статья раскрывает, как семантическая сегментация помогает машинам «видеть», разбивая изображение на классы объектов. Обсуждаются её применение в автономных авто, медицине и обработке спутниковых снимков для точного распознавания контекста.

Читать...

Data Science | Machinelearning [ru]

19 Jan, 18:07


🔥 Самые интересные статьи за последние дни:

• Всё, что вы хотели знать о Django Channels

• Сборка Python проекта с uv и Docker

• DE-1. DIY ассистент на LLM

• Ваши генераторные выражения сломаны: чиним и разбираемся

• Всё, что вы хотели знать о Django Channels

Data Science | Machinelearning [ru]

19 Jan, 10:07


📊 ИИ в Крипто-Торговле: Возможен ли Успех?

Статья описывает процесс создания успешных ИИ-моделей для автоматизированной крипто-торговли на ByBit. Рассматриваются три стратегии, их разработка, оптимизация и результаты, превысившие убытки.

Читать...

Data Science | Machinelearning [ru]

18 Jan, 18:07


🔎 Подборка зарубежных вакансий

Senior Data Scientist (Recommender Systems)
🟢Python, PyTorch, PySpark
🟢от 5 000 до 6 500 € до вычета налогов | 3–6 лет опыта

Senior Data Engineer в международный проект HealthTech
🟢Python, Apache Spark, AWS, SQL, NoSQL
🟢Уровень дохода не указан | 3–6 лет опыта

Data Engineer
🟢DBT, Amazon Redshift, Fivetran, Python, ETL, Amazon Web Services, SQL
🟢Уровень дохода не указан | 3–6 лет опыта

Data Science | Machinelearning [ru]

18 Jan, 14:07


Коллеги, закинули новый таск — заценить зимний раннер от Х5 Tech!

«Беги в X5 Tech, беги» — это игра, где вам предстоит достигнуть ускорения X5, познакомиться с технологиями и карьерными возможностями в X5 Tech, а также побороться за призы — Apple AirPods Pro, Apple Watch SE, Яндекс Станцию Миди и сертификаты в «Перекрёсток» и «Пятёрочку»!

Кстати, всем пробежавшим хотя бы одну дистанцию подарят полезный промокод — проходите игру, чтобы узнать, как Х5 Tech строит самый эффективный ритейл в мире благодаря IT и инновациям >>

Data Science | Machinelearning [ru]

18 Jan, 10:07


🧠 Эмоциональное принятие решений в LLM: исследование, которое мы показали на NeurIPS 2024

На NeurIPS 2024 группа «ИИ в промышленности» представила исследование по эмоциональным большим языковым моделям (LLM). Рассмотрены два подхода: строгая оптимальность и эмоциональный алайнмент. Как LLM правильно эмулируют эмоции? Узнаем!

Читать...

Data Science | Machinelearning [ru]

17 Jan, 18:07


✔️ Простой и быстрый тест LLM для прототипа: сравниваем 16 open-source-моделей на запросе с разной температурой

В статье рассказывается, как быстро протестировать 16 LLM для создания текстовых прототипов, даже если вы не в теме ML. Берём несколько моделей, сравниваем результаты, оцениваем, подходит ли под задачу.

Читать...

Data Science | Machinelearning [ru]

17 Jan, 10:07


➡️ ИИ в логистике: отслеживаем транспортные средства на производственной территории с помощью нейросети

В статье описан путь от пет-проекта до системы для трекинга транспорта: нейросети, компьютерное зрение и инструменты, позволяющие «видеть» и анализировать производственные процессы.

Читать...

Data Science | Machinelearning [ru]

17 Jan, 08:07


Приглашаем вас на открытый вебинар: «Технологии за современными LLM»
https://otus.pw/nI3x/

Дата: 20 января в 18:00 мск
Спикер: Мария Тихонова

📚На занятии мы обсудим:

+ Какие современные LLM сегодня используют на практике.
+ Основные концепции языкового моделирования и продвинутые языковые модели.
+ Методы и технологии, благодаря которым создатели ChatGPT совершили прорыв.
+ Что представляет из себя задача языкового моделирования
+ Языковые модели, которые сегодня лежат в основе всех NLP методов

🔥Результаты урока:

- Вы поймете, где применяются методы NLP
- Узнаете основные тренды и перспективы развития методов NLP
- Узнаете современное состояние области в связи с быстрым развитием LLM

Участники открытых уроков получат скидку🎁 на онлайн-курс «NLP / Natural Language Processing»

👉Регистрируйтесь на открытый вебинар по ссылке: https://otus.pw/nI3x/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqxXrK6s

Data Science | Machinelearning [ru]

16 Jan, 18:07


📈 Подборка статей для вашей карьеры

• Мои Red-Flags при устройстве в IT-компании: Как не стать гребцом. Часть 2

• Как строить карьеру в корпорации

• История: работа в чешском Red Hat

• Циничные заметки о карьере в IT от «гейткипера»

• Моя петиция EB-1A на грин-карту талантов, одобренная с первой попытки

Data Science | Machinelearning [ru]

16 Jan, 14:07


📝 Подборка вакансий для сеньоров

Database Administrator
ClickHouse, PostgreSQL, Debian/Ubuntu, Systemd, TCP/IP, iptables, SSH, x509-сертификаты, Bash, LVM
до 5 000 $ | от 3 лет опыта

Data engineer
SQL, Hive-SQL, Spark, AirFlow, Git, DWH, реляционные и NoSQL базы данных
Уровень дохода не указан | от 2 лет опыта

Data-аналитик (Senior)
SQL, PostgreSQL, Greenplum, ETL, DWH, оконные функции, оптимизация запросов
Уровень дохода не указан | от 2 лет опыта

Data Science | Machinelearning [ru]

16 Jan, 10:17


🤔 Реальная эффективность Qwen 2.5 Coder против ChatGPT (или можно ли сэкономить 20$?)

В статье будет рассмотрена практическая проверка возможностей модели Qwen 2.5 Coder на основе задачи перевода кода из VB в C#. Узнаем, сможет ли она справиться с нюансами цикла и корректно адаптировать формулу.

Читать...

Data Science | Machinelearning [ru]

16 Jan, 07:17


Станьте инженером данных с нуля за 5 месяцев, обучаясь на реальных задачах бизнеса.

Основная проблема обучений – оторванность от задач реального бизнеса. На курсе учился складывать 2+2, а на работе – сразу отправляют считать интегралы.

Курс-симулятор от Simulative построен таким образом, что вы сразу погружаетесь в настоящую работу: например, вы будете формировать продуктовые рекомендации для клиентов крупного телекома с помощью Clickhouse.

Обучение охватывает весь стек, который нужен специалисту: SQL, Python, Metabse, Linux, Docker, Airflow, Clickhouse, Hadoop и Spark. А также готовит к любому собеседованию – в курс включены тестовые задания, пробные интервью (технические и с HR) и многое другое.

С трудоустройством поможем, а на VIP тарифе преподаватели и HR спроектируют вам персональный трек обучения и за руку доведут до оффера. Часть стоимости курса вы оплачиваете только, когда найдёте работу.

Еще успеваете записаться в текущий поток.
По промокоду DEV дарим скидку 12%

Data Science | Machinelearning [ru]

15 Jan, 18:07


👩‍💻 FlexiPrompt: Удобное создание динамических промптов в Python

Статья знакомит с FlexiPrompt — лёгкой библиотекой для генерации промптов в Python при работе с языковыми моделями. Рассмотрены её преимущества: быстрая интеграция, гибкая настройка диалога и возможность создания нескольких агентов в одной LLM.

Читать...

Data Science | Machinelearning [ru]

15 Jan, 10:07


🤔 3750 дней разработки AI или почему боты всё ещё не захватили покер

Статья рассматривает создание AI для покера (Техасского безлимитного холдема) и анализирует его сложность как модели бизнес-отношений. Обсуждаются метрики и стратегии, которые игроки используют в изменяющемся контексте для принятия решений.

Читать...

Data Science | Machinelearning [ru]

14 Jan, 18:07


📝 Подборка вакансий для мидлов

Data-аналитик
Python, SQL, Apache Hadoop, Kubernetes, Docker
Уровень дохода не указан | от 2 лет опыта

Data-инженер
Python, Greenplum, Apache Airflow, Apache Spark, ETL, Apache Hadoop, Linux, PostgreSQL, Kubernetes, SQL
Уровень дохода не указан | от 2 лет опыта

Data Analyst
Python, Apache Spark, SQL, Apache Hadoop
Уровень дохода не указан | от 2 лет опыта

Data Science | Machinelearning [ru]

14 Jan, 10:07


🤔 Prompt Me One More Time. Учим LLM строить графы знаний из текстов

Статья описывает метод, разработанный для автоматического наполнения графов знаний с помощью LLM, что снижает вероятность «галлюцинаций» и повышает точность ответов. Решение Prompt Me One More Time подробно представлено на TextGraphs-17 конференции ACL-2024.

Читать...

Data Science | Machinelearning [ru]

13 Jan, 18:07


🔎 Подборка вакансий для джунов

Data-аналитик в области временных рядов (Junior)
🟢Python, pandas, numpy, scipy, matplotlib, seaborn, SQL
🟢от 40 000 ₽ до вычета налогов | 1–3 года опыта

Продуктовый аналитик/junior product менеджер
🟢SQL, Google Analytics, Tableau, Power BI, BigQuery, Looker, UML, Use Case Analysis
🟢от 100 000 ₽ на руки | 1–3 года опыта

Data-инженер
🟢SQL, C#, MS Visual Studio, Big Data
🟢от 140 000 ₽ на руки | 1–3 года опыта

Data Science | Machinelearning [ru]

13 Jan, 10:08


⚙️ Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Продолжение

Статья продолжает разбор моделирования температурного временного ряда с двойной сезонностью. Основное внимание уделено подбору оптимальных параметров сезонной модели САРПСС для точного описания данных.

Читать...

Data Science | Machinelearning [ru]

08 Jan, 18:07


💬 Внедрение ИИ в общение с клиентами

Статья исследует развитие ИИ в общении с клиентами и его интеграцию в бизнес. Обсуждаются успехи и сложности внедрения чат-ботов, важность настройки под бизнес-цели и перспективы замены сотрудников ИИ.

Читать...

Data Science | Machinelearning [ru]

08 Jan, 10:07


⚙️ Нейросетевой апскейлинг дома: вторая молодость для классических мультфильмов

Статья рассказывает, как с помощью нейросетей улучшить качество старых видеозаписей, включая VHS и DVD. Описываются инструменты, процесс и результаты с примерами, доступные каждому без глубоких технических знаний.

Читать...

Data Science | Machinelearning [ru]

07 Jan, 18:07


📝 Подборка вакансий для мидлов

Аналитик данных Middle+ / Data Analyst
Python, SQL, A/B тестирование
от 200 000 до 300 000 ₽ | Средний (Middle) уровень

Аналитик данных
SQL, PostgreSQL, Greenplum, Apache Airflow, DWH, Apache Spark
от 280 000 до 350 000 ₽ | Средний (Middle) уровень

Инженер по компьютерному зрению
Python, OpenCV, TensorFlow, PyTorch, машинное обучение, глубокое обучение
Уровень дохода не указан | Требуемый опыт не указан

Data Science | Machinelearning [ru]

07 Jan, 10:07


🤔 Данные — это ископаемое топливо для ИИ. Правда, что мы его исчерпали?

В статье обсуждается заявление Ильи Суцкевера о том, что данные для ИИ сравнимы с ископаемым топливом, и их запас исчерпан. Объясняется концепция энтропии данных и её значение для LLM.

Читать...

Data Science | Machinelearning [ru]

07 Jan, 08:17


⚡️ В сети начали массово сливать курсы и книги известных онлайн школ

Вот отсортированная база с тонной материала(постепенно пополняется):

БАЗА (4687 видео/книг):

(363 видео, 87 книги) — Python
(415 видео, 68 книги) — Frontend
(143 видео, 33 книги) — ИБ/Хакинг
(352 видео, 89 книги) — С/С++
(343 видео, 87 книги) — Java
(176 видео, 32 книги) — Git
(293 видео, 63 книги) — C#
(174 видео, 91 книги) — DevOps
(167 видео, 53 книги) — PHP
(227 видео, 83 книги) — SQL/БД
(163 видео, 29 книги) — Linux
(107 видео, 43 книги) — СисАналз
(181 видео, 32 книги) — Go
(167 видео, 43 книги) — Kotlin/Swift
(112 видео, 24 книги) — Flutter
(137 видео, 93 книги) — DS/ML
(113 видео, 82 книги) — GameDev
(183 видео, 37 книги) — UI/UX
(129 видео, 73 книги) — QA
(213 видео, 63 книги) — Rust
(121 видео, 24 книги) — Ruby

Скачивать ничего не нужно — все выложили в Telegram

Data Science | Machinelearning [ru]

06 Jan, 18:07


🔎 Подборка вакансий для джунов

AI/Data Specialist (Эксперт по AI/ML / Data Ops)
🟢Python, pandas, numpy, scikit-learn, PyTorch, TensorFlow, MLOps, CI/CD, ML-пайплайны, компьютерное зрение, обработка естественного языка
🟢от 180 000 до 300 000 ₽ на руки | 1–3 года опыта

Аналитик SQL / Data Analyst
🟢SQL, PostgreSQL, MySQL, Python, ETL, Airflow, API, анализ данных, визуализация данных, BI-инструменты, DataLens
🟢от 110 000 ₽ на руки | 1–3 года опыта

Аналитик данных/data analyst контактного центра (CPA nutra)
🟢Excel, анализ данных, BI-отчётность, оптимизация процессов, контактные центры, CPA nutra
🟢от 80 000 ₽ на руки | 1–3 года опыта

Data Science | Machinelearning [ru]

06 Jan, 10:07


➡️ Глубокое обучение: Алгоритм обратного распространения ошибки. Теория и реализация. С нуля

Обратное распространение ошибки — основа обучения нейросетей. В статье: архитектура, расчет производных, реализация сетей для задач «ИЛИ» и MNIST. Простые шаги к пониманию алгоритма!

Читать...

Data Science | Machinelearning [ru]

05 Jan, 18:07


👀 Сравнение 30 фотореалистичных ИИ-изображений: Flux1.1 против SD3.5

В статье обсуждаются возможности Flux1.1 Pro и SD3.5 Large в генерации фотореалистичных изображений. Описаны различия моделей и их результаты после разделения команды разработчиков.

Читать...

Data Science | Machinelearning [ru]

05 Jan, 10:07


🤖 Как удалить Excel навсегда: делегируем юнит-экономику на Wildberries нейронке

Статья объясняет, как нейросети помогают оптимизировать юнит-экономику продавцов на WB, особенно при работе с большим ассортиментом. Рассматриваются подходы к автоматизации анализа и принятию решений.

Читать...

Data Science | Machinelearning [ru]

04 Jan, 18:07


🔎 Подборка зарубежных вакансий

Marketing Analyst
🟢SQL, Power BI, Marketing Analysis, Google Analytics, Business English, API
🟢от 2 500 до 4 000 $ до вычета налогов | 1–3 года

Data Scientist (mobile+web)
🟢Big Data, Amplitude, Power BI, A/B Testing, Predictive Modeling, Python
🟢от 4 000 $ до вычета налогов | 3–6 лет

Data Analyst & Mathematical
🟢Python, Теория вероятностей, Математическая статистика, Статистический анализ, Оптимизационное моделирование
🟢Уровень дохода не указан | 3–6 лет

Data Science | Machinelearning [ru]

04 Jan, 14:07


📢 Делай демо своих решений

Закрыл задачу, но никто не понимает, насколько крутое решение ты сделал? Это минус не только для команды, но и для твоей репутации.

👉 Совет: каждую значимую доработку презентуй команде. Покажи, как работает функционал, объясни, почему выбрал этот подход. Это не только помогает коллегам разобраться, но и показывает твой вклад в общий результат.

Data Science | Machinelearning [ru]

04 Jan, 10:07


🔥 Дообучаем языковую модель GPT2 с помощью Torch

Статья углубляется в дообучение языковых моделей, используя DistilGPT2 на данных QuyenAnhDE/Diseases_Symptoms. Рассматривается процесс настройки модели для генерации симптомов на основе заболеваний, с возможностью расширения логики.

Читать...

Data Science | Machinelearning [ru]

04 Jan, 06:07


Разбираем тестовое задание на позицию Junior Аналитика в Яндекс.

Чтобы найти работу, мало пройти курс и сделать классное резюме. На практике, чтобы выделиться на собеседовании, нужно понимать, что лежит под капотом каждого инструмента, а не следовать конкретному заученному алгоритму.

Чтобы попрактиковаться в этом, приходите на бесплатный вебинар, где будем разбирать реальное тестовое задание, которое дают аналитикам в подразделении Яндекс Картинки.

Что будет на вебинаре:
🟠С помощью Python решим рутинные задачи - разархивировать файлы, прочитать большой json и т.д.
🟠С помощью Pandas проанализируем поисковые запросы Яндекс.Картинок
🟠С помощью Plotly построим интерактивные графики и сделаем выводы
🟠Найдем статистически значимую разницу в поведении пользователей на разных устройствах

Вебинар проведет Андрон Алексанян, CEO Simulative

🎁Обязательно приходите смотреть вебинар в прямом эфире - в лайве будут дарить подарки, которые сильно бустанут старт карьеры в аналитике!

Зарегистрироваться на бесплатный вебинар

Data Science | Machinelearning [ru]

03 Jan, 18:07


⚙️ Инфраструктура для Data-Engineer BI-tools

В этой статье я хотел бы показать куда уходят данные и что с ними происходит, когда пайплайны дата-инженеров заканчивают работу.

Читать...

Data Science | Machinelearning [ru]

03 Jan, 10:07


⚙️ Умножение троичных матриц для нейросетей

Статья исследует использование троичных значений (-1, 0, 1) в нейросетевых матрицах. Рассматриваются методы хранения тритов с использованием 32-битной арифметики и подходы к их быстрому умножению через оптимизацию памяти.

Читать...

Data Science | Machinelearning [ru]

02 Jan, 18:07


📈 Подборка статей для вашей карьеры

• Пришёл на вакансию дизайнера, а стал питонистом: как IT-специалисты нашли свою первую работу

• На сколько денег может рассчитывать ИТ-предприниматель в разных ветках развития

• Анализ задачи с собеседования в Google: конь и телефонные кнопки

• Быстрый старт в QA Fullstack: чем вооружиться будущему стажеру в Альфа-Банке

• Как убить самоорганизацию в команде: вредные советы для лидера

Data Science | Machinelearning [ru]

02 Jan, 14:07


📝 Подборка вакансий для сеньоров

Data Engineer
Python, SQL, Apache Airflow, Greenplum, Apache Spark
от 250 000 ₽ на руки | 1–3 года

Senior Data Scientist (FinTech)
Python, Pandas, NumPy, SciKit-Learn, PyTorch, TensorFlow, SQL, Теорвер и матстат
от 300 000 ₽ на руки | Более 6 лет

Senior Data Engineer
Apache Hadoop, Spark (batch/streaming), Scala, SQL, Parquet, Hive, Kafka, HBase, ClickHouse, PostgreSQL, Airflow, Zeppelin, Jupyter, S3 MinIO
Уровень дохода не указан | от 5 лет

Data Science | Machinelearning [ru]

02 Jan, 10:07


⚙️ Машинное обучение: Наивный байесовский классификатор. Теория и реализация. С нуля

Статья описывает три основные разновидности наивного байесовского классификатора: мультиномиальный, гауссовский и бернулли. Рассмотрены их теоретические основы, особенности и примеры реализации.

Читать...

Data Science | Machinelearning [ru]

31 Dec, 18:07


📝 Подборка вакансий для мидлов

Data-аналитик
SQL, Tableau, Amplitude, PostgreSQL
от 200 000 до 300 000 ₽ на руки | 1–3 года

Data Scientist (генерация графических изображений)
Python, YOLO8, Stable Diffusion 1.5, OpenCV, RASA, NLP, LLMs
от 200 000 до 500 000 ₽ на руки | 3–6 лет

Data Scientist (модели PD)
Python, SQL, Machine Learning, A/B Testing, Risk Modeling
Уровень дохода не указан | 3–6 лет

Data Science | Machinelearning [ru]

31 Dec, 10:07


⚙️ Пишем свою Diffusion модель с нуля

Статья предлагает разобраться в устройстве Diffusion моделей, их математике и принципах работы. Автор делится простыми объяснениями, примерами кода и результатами генерации изображений на собственной модели.

Читать...

Data Science | Machinelearning [ru]

30 Dec, 18:07


📝 Подборка вакансий для джунов

Младший аналитик
Python, SQL, Microsoft Excel, Анализ данных, Машинное обучение, Нейронные сети
от 130 000 ₽ на руки | 1–3 года

Консультант-аналитик [ССД Oracle]
SQL, Oracle, Английский язык, Аналитика, Системное тестирование
Уровень дохода не указан | 1–3 года

Инженер данных/Data Engineer в Управление анализа данных
SQL, Apache Hadoop, Bitbucket, Jira, Confluence
Уровень дохода не указан | 1–3 года

Data Science | Machinelearning [ru]

30 Dec, 10:07


✔️ Big Data мертвы, да здравствуют Smart Data

Давайте рассмотрим концепцию Smart Data и выясним, действительно ли Big Data превращаются во что-то более интеллектуальное.

Читать...

Data Science | Machinelearning [ru]

29 Dec, 18:07


🔥 Самые интересные статьи за последние дни:

• о3 теснит программистов? Как OpenAI снова всех удивила

• AI, который всё за нас решит

• Второе пришествие мейнфреймов. Всё больше компаний хотят запускать ИИ у себя в офисе

• Обзор на разнообразные интерфейсы Stable Diffusion. Automatic1111 — не одинок

Data Science | Machinelearning [ru]

29 Dec, 10:07


➡️ Будущее LLM в XS, S, M и других размерах

В статье обсуждаются подходы к обучению ИИ оптимально использовать свои ресурсы: от минимальной мощности для простых задач до максимума для сложных. Разбираем концепции «я не знаю» и запросов помощи.

Читать...

Data Science | Machinelearning [ru]

28 Dec, 19:07


🔎 Подборка зарубежных вакансий

Python developer в ML
🟢Python, PyTorch, FastAPI
🟢Уровень дохода не указан | 3–6 лет

Ai Specialist
🟢Python, Java, C++, TensorFlow, Keras, PyTorch, Excel, Tableau
🟢Уровень дохода не указан | 3–6 лет

Senior QA Engineer (Server Team)
🟢Python, Тестирование, Тестирование back-end, API
🟢Уровень дохода не указан | 3–6 лет

Data Science | Machinelearning [ru]

28 Dec, 16:07


Уголок AI-энтузиастов от Сбера 🤖

Sber AI Lab — центр экспертизы Сбера в области искусственного интеллекта и активный участник глобального научного комьюнити.

Команда создаёт полезные алгоритмы, фреймворки и технологии в разных сферах: от банкинга до медицины.

Топ по количеству научных статей на A*/A конференции и Q1 журналы в Сбере

Среди open-source решений лаборатории ИИ: LightAutoML (победитель Kaggle Grand Prix 2024), RePlay, pytorch-lifestream, eco2ai и другие инструменты. Узнать больше о решениях можно на GitHub.

Ты можешь стать частью нашей команды и сделать свой вклад в развитие AI-проектов в интересных тебе направлениях тут.

Data Science | Machinelearning [ru]

28 Dec, 14:07


⚙️ Делай задачи «гибкими» для будущего

Пишешь решение, которое идеально подходит для текущей задачи, но через месяц оно уже устарело? Это классика.

👉 Совет: думай на шаг вперёд. Вместо жёсткой привязки к конкретным условиям добавь настройку, сделай код модульным или оставь место для расширения. Так ты сэкономишь время себе и коллегам, когда задача внезапно изменится.

Data Science | Machinelearning [ru]

28 Dec, 10:07


🤔 Будущее LLM: 7 прогнозов на 2025 год

Что нового ждёт языковые модели в 2025 году? Обсудим прогнозы: расширение возможностей ИИ, их внедрение в бизнес и жизнь. Узнайте, чего ожидать и почему Джарвис пока останется мечтой.

Читать...

Data Science | Machinelearning [ru]

27 Dec, 18:07


🔎 Подборка вакансий для лидов

Senior Data Engineer (Python, Spark, SQL)
🟢Python, SQL, PySpark, ETL, ELT, AWS, GCP, Azure, BigQuery, RDS, Azure SQL DB
🟢Уровень дохода не указан | 3–6 лет

Data Domain Leader
🟢SQL, Python, Spark, ETL, Data Architecture, Data Warehousing, Agile, Scrum
🟢до 400 000 ₽ до вычета налогов | более 6 лет

Lead Financial Data Engineer / Analyst
🟢SQL, SSIS, Visual Studio, Microsoft Excel
🟢от 500 000 ₽ до вычета налогов | более 6 лет

Data Science | Machinelearning [ru]

27 Dec, 14:07


🧠 Прогнозы развития ИИ в 2025 году: версия «Ведомости. Технологии»

Статья рассказывает об основных трендах в развитии искусственного интеллекта. Эксперты считают, что ИИ будет двигаться в сторону мультимодальности, гиперперсонализации и автономных систем. Также на рынке будет больше решений с открытым кодом, которые, по словам эксперта из Яндекса, поспособствуют повышению скорости разработки инновационных продуктов и созданию более доступных технологий.

Читать…

Data Science | Machinelearning [ru]

27 Dec, 10:07


⚙️ Как устроена Лаборатория Инноваций СИБУРа и зачем она нужна

Как применять ИИ и цифровизацию в гигантской промышленной компании с десятками заводов? Узнайте, как СИБУР реализует более 30 успешных кейсов и работает с сотнями гипотез в Лаборатории ИИ.

Читать...

Data Science | Machinelearning [ru]

27 Dec, 06:07


🎄Hо-hо-hо! Новогодняя акция от NeuromateAI

NeuromateAI — ваш умный AI-ассистент, который поможет:
🔹ускорить рабочие процессы
🔹писать код быстрее с помощью подсказок и готовых решений
🔹анализировать большие данные и упрощать сложные вычисления
🔹генерировать идеи для новых проектов или оптимизации существующих

C 20 декабря до 10 января действуют скидки до 30% на все годовые тарифы — начни новый год с вложений в своё развитие с единой подпиской на самые популярные нейросети ⚡️

С NeuromateAI вы сможете сделать обучение более продуктивным и увлекательным. Подарите себе возможности для роста в 2025 году!

👉 Попробуйте NeuromateAI по выгодным условиям

Data Science | Machinelearning [ru]

26 Dec, 18:07


📈 Подборка статей для вашей карьеры

• «Снова упала?» Как поднять самооценку и зачем мы сравниваем себя с другими, даже если от этого больно

• Из учителя в QA: мой путь в IT

• Рынок дата-инженеров и прогноз на 2025

• Как сделать резюме, которое дойдёт до работодателя. Фильтры ATS в 2025 году

• Ошибайся смело: жизненные уроки из мира machine learning

Data Science | Machinelearning [ru]

26 Dec, 14:08


🔎 Подборка вакансий для сеньоров

Senior Data Engineer
🟢Python, Spark, Hadoop, Docker, Kubernetes, SQL, CI/CD
🟢от 400 000 ₽ на руки | 3–6 лет

Senior Data Analyst (Medtech)
🟢SQL, Tableau, Power BI, Python, R, Data Warehousing, Statistics
🟢до 330 000 ₽ на руки | 3–6 лет

Senior Data Scientist (Recommender Systems)
🟢Python, PyTorch, Recommender Systems, A/B Testing, ClickHouse, Jenkins, Airflow
🟢от 5 000 до 6 500 € до вычета налогов | 3–6 лет

Data Science | Machinelearning [ru]

26 Dec, 10:07


➡️ Добро пожаловать в CAMELoT

В статье рассказывается о новой архитектуре CAMELoT, которая помогает большим языковым моделям обрабатывать длинные последовательности, не требуя повторного обучения. Она использует ассоциативную память для улучшения производительности.

Читать...

Data Science | Machinelearning [ru]

25 Dec, 18:07


⚙️ Автоматизация верификации кодовых датасетов подрядчиков с помощью LLM: снизили брак на 40% и сократили стоимость на 60%

Статья рассказывает, как автоматизация на основе LLM ускорила верификацию данных и сократила ошибки в производственной цепочке. Узнаете, как это помогло заказчику сэкономить ресурсы и время.

Читать...

Data Science | Machinelearning [ru]

25 Dec, 10:07


🔫 Claude сопротивляется

Исследование Anthropic показывает, как их ИИ Claude мог притворяться злым, чтобы избежать «переобучения». Модель следовала поддельным документам для бесплатных пользователей, но сопротивлялась для премиум-аудитории.

Читать...

Data Science | Machinelearning [ru]

25 Dec, 06:07


7 вещей, которые я понял, работая в ML

Ребята из ML-команды Купера рассказали о главных инсайтах, которые они извлекли за время работы, дали советы начинающим специалистам, разобрали, как справляться с вызовами этой профессии.

💫Какими компетенциями обладает ML-специалист? 

💫Как помнить про цель и искать свой путь? 

💫Какие вызовы могут возникнуть при смене карьерного трека?

💫Почему важно думать про бизнес и решать правильные задачи? 

Ответы на эти и другие вопросы вы найдете в ролике на YouTube и в VK Видео!

Возможно, вы узнаете себя в этих историях и получите вдохновение для новых карьерных свершений!

Реклама. ООО «ИНСТАМАРТ СЕРВИС», ИНН: 9705118142. Ерид: 2W5zFJiu8SC

Data Science | Machinelearning [ru]

24 Dec, 18:07


📝 Подборка вакансий для мидлов

Data Scientist (Реком. системы)
Python, SQL, Keras, PyTorch, Docker, Airflow, ClickHouse, A/B Testing, Recommender Systems
Уровень дохода не указан | 1–3 года

Data Analyst (F&R)
SQL, Python, Microsoft Excel, BI, Apache Superset, Математическая статистика, Анализ данных
Уровень дохода не указан | Более 6 лет

Data Scientist (генерация графических изображений)
Python, YOLO8, Stable Diffusion 1.5, OpenCV, RASA, NLP, LLMs
от 200 000 до 500 000 ₽ на руки | 3–6 лет

Data Science | Machinelearning [ru]

24 Dec, 10:07


👩‍💻 Пишем свой PyTorch на NumPy. Часть 1

PyTorch — это мощный и гибкий фреймворк для машинного обучения, широко используемый для создания нейронных сетей. Он особенно популярен благодаря простоте использования, динамическим вычислительным графам и богатой экосистеме инструментов для обучения моделей.

В этой статье мы реализуем собственную библиотеку машинного обучения на NumPy!

Читать...

Data Science | Machinelearning [ru]

23 Dec, 18:07


🔎 Подборка вакансий для джунов

Junior Аналитик данных
🟢MySQL, Metabase, Python (pandas, NumPy)
🟢от 30 000 до 50 000 ₽ | 1–3 года опыта

Junior Data Engineer (Analyst)
🟢SQL, Qlik Sense, Grafana, Python, PostgreSQL
🟢от 250 000 ₸ до вычета налогов | Без опыта

Junior Python Backend разработчик
🟢Python, FastAPI, PostgreSQL, SQLAlchemy
🟢от 40 000 ₽ | Без опыта

Data Science | Machinelearning [ru]

23 Dec, 10:07


🧠 Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц

Как машинное обучение помогает управлять ускорителями частиц? В статье раскрываются примеры применения нейронных сетей, обучения с подкреплением и байесовской оптимизации для стабилизации и настройки пучков частиц.

Читать...

Data Science | Machinelearning [ru]

23 Dec, 07:07


Приглашаем вас на открытый вебинар: «Технологии NLP сегодня: основные тренды в области и перспективы развития»

Дата: 25 декабря в 18:00 мск
Спикер: Мария Тихонова

📚На занятии мы обсудим:
- Из чего складывается область NLP
- Поговорим про последние тренды в этой сфере,
возникшие с появлением современных LLM. 

🔥Результаты урока:
- Вы поймете, где применяются методы NLP
- Узнаете основные тренды и перспективы развития методов NLP
- Узнаете современное состояние области в связи с быстрым развитием LLM

🧩Кому подходит этот урок:
- IT-специалистам, которые хотят расширить свои знания в Data Science
- Дата-сайентистам, желающим углубить свои знания по автоматической обработке текстов
- Тем кто самостоятельно изучает Data Science

Участники всех открытых уроков получат скидку🎁 на большое обучение

👉Регистрируйтесь на открытый вебинар по ссылке: https://vk.cc/cGkS1o

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Data Science | Machinelearning [ru]

22 Dec, 18:07


🔥 Самые интересные статьи за последние дни:

• Что читали на Хабре в 2024 году: анализ статей с Node.js, Google Sheets и каплей ChatGPT

• Поднимаем в облаке расшифровку речи в текст с помощью нейросетей. VPS на пределе возможностей

• Стоит ли ChatGPT о1 Pro своих денег? Небольшой тест-драйв модели

• Возможности LLM и RAG на примере реализации бота для поддержки клиентов

• Гетерогенные вычисления: проектирование и разработка вычислительной системы для нейросетей

Data Science | Machinelearning [ru]

22 Dec, 14:07


🤖 Обзор 4 новых инструментов AI для программирования: v0, Bolt.new, Cursor, Windsurf

Обзор четырёх инструментов для разработчиков: v0, Bolt.new, Cursor и Windsurf. Сравнение функций, сценариев использования и цен поможет выбрать подходящее решение для повышения продуктивности и оптимизации процессов.

Читать...

Data Science | Machinelearning [ru]

22 Dec, 10:07


Новогодний коллаб Cloud.ru х Самокат

Cloud․ru — это провайдер облачных сервисов и AI-технологий, который делает доступ к облакам и искусственному интеллекту простым и удобным. Компания заботится о клиентах во всех аспектах: от сохранности их инфраструктуры в облаке до предоставления простых и удобных сервисов.


Cloud․ru вместе с Самокатом позаботились о здоровом перекусе айтишников. Для этого создали специальный снек-бокс, который до 31.12 получат 22 000 счастливчиков в Москве и Питере вместе со своими заказами. А для всех пользователей Самоката заботливо собрали подборку быстрых перекусов. Переходите по ссылке и по промокоду CLOUDRU вы получите скидку 100 рублей при заказе товаров из подборки от 500 рублей.

Реклама. ООО "Умный ритейл", ИНН 7811657720. erid: 2VtzqwfLH2r

Data Science | Machinelearning [ru]

21 Dec, 18:07


🔎 Подборка зарубежных вакансий

Data Scientist | Data Analyst
🟢Python, SQL, Power BI, AI (GPT, AutoGPT, Langchain), DWH, BigQuery, Snowflake, Redshift
🟢от 2 000 $ на руки | 1–3 года

Marketing Analyst
🟢SQL, Power BI, Marketing Analysis, Google Analytics, Business English, API
🟢от 2 500 до 4 000 $ до вычета налогов | 1–3 года

Senior Data Scientist
🟢Python, SQL, RecSys, Uplift Modeling, Churn Prediction, LTV Prediction, Forecasting, MLOps
🟢от 4 500 до 6 500 $ до вычета налогов | Более 6 лет

Data Science | Machinelearning [ru]

21 Dec, 10:07


🤔 Стоит ли ChatGPT о1 Pro своих денег? Небольшой тест-драйв модели

В статье предлагается протестировать новую модель o1 в режиме pro, сравнить её с ChatGPT o1 и ChatGPT 4o. Разберёмся, насколько она оправдывает свою стоимость и как показывает себя на практике.

Читать...

Data Science | Machinelearning [ru]

20 Dec, 20:07


🔎 Подборка вакансий для лидов

AI Data Group Lead
🟢Python, TensorFlow, PyTorch, Scikit-learn, Oracle DWH, Hadoop, SQL, Jupyter, Pandas, Matplotlib
🟢Уровень дохода не указан | 1–3 года

Team Lead Data Scientist
🟢Python, SQL, RecSys, Uplift Modeling, Churn Prediction, LTV Prediction, Forecasting, MLOps
🟢Уровень дохода не указан | Более 6 лет

Team Lead Data Analyst
🟢SQL, Python, ClickHouse, Power BI, Redash, Superset, Metabase, dbt, Airflow
🟢от 300 000 до 450 000 ₽ на руки | 3–6 лет

Data Science | Machinelearning [ru]

09 Dec, 18:07


🔎 Подборка вакансий для джунов

Data Scientist в области языковых моделей (Junior)
🟢Python, pandas, numpy, matplotlib, обработка текстовых данных, машинное обучение, языковые модели (LLM), библиотека Hugging Face
🟢от 190 000 ₽ до вычета налогов | 1–3 года

Data-аналитик в области временных рядов (Junior)
🟢Python, pandas, numpy, scipy, matplotlib, seaborn, анализ временных рядов, SQL
🟢от 190 000 ₽ до вычета налогов | 1–3 года

Junior Data Engineer
🟢SQL, MS Excel, Access, ETL, OLAP, английский язык
🟢Уровень дохода не указан | 1–3 года

Junior Data Analyst
🟢SQL, MS SQL Server, PostgreSQL, Python, Git, статистический анализ, A/B тестирование, машинное обучение
🟢Уровень дохода не указан | 1–3 года

Data Science | Machinelearning [ru]

09 Dec, 10:07


⚙️ Как я взломал одну из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи

Статья раскрывает исследование по снятию защиты в современной языковой модели ИИ. Описан процесс автоматизации взлома модели и представлена программа, демонстрирующая успешный обход встроенных механизмов безопасности.

Читать...

Data Science | Machinelearning [ru]

09 Dec, 06:07


Салют от команды GigaChat! Приглашаем на конференцию по технологиям ИИ

📆 17 декабря, 12:30 (МСК, GMT+3)
📍 Офлайн в Москве. Для посещения в офлайне нужно дождаться приглашения от организаторов.
🌐 Онлайн-трансляция на сайте SberDevices

В программе — 9 докладов о том, как ИИ учится говорить, слышать, фильтровать данные и помогать людям. Спикеры расскажут про создание ИИ-агентов и персонажей, эмбеддинги и навыки моделей. Поделятся способами фильтровать данные и быстро обучать мощные модели.

Вас ждут новости разработки GigaChat и ассистента Салют, а также расскажут про open-source модели.

Участвуйте в дискуссиях с другими участниками и задавайте вопросы спикерам во время докладов. А офлайн-участников ждут афтерпати и стенды с технологиями: можно будет протестировать GigaChain и технологии GigaChat Audio, а также поработать с гипотезами в GigaPlayground.

Для участия нужно зарегистрироваться на сайте.

Больше подробностей — в Telegram-канале конференции.

Реклама. ПАО Сбербанк. ИНН 7707083893

Data Science | Machinelearning [ru]

08 Dec, 18:07


🔥 Самые интересные статьи за последние дни:

• Построение базы знаний компании и поиска документов на LLM и RAG

• Что побуждает LLM врать и как этого избежать в своих продуктах

• Ломаем капчу 4Chan

• На чём учатся современные модели машинного перевода: опыт команды Яндекс Переводчика

• Gemini вырывается вперед, Китай спамит моделями, в Minecraft запустили AI-агентов: главные события ноября в сфере ИИ

Data Science | Machinelearning [ru]

08 Dec, 10:07


💬 Голосовая аутентификация через GPT

Статья исследует возможность аутентификации пользователей GPT-чата во внешних приложениях. Рассматривается голосовое взаимодействие и альтернативный способ аутентификации через пароли вместо OAuth 2.0.

Читать...

Data Science | Machinelearning [ru]

07 Dec, 18:07


🧠 Тренируй «мышцы контекстного переключения»

Работаешь сразу над несколькими проектами, но каждый раз, переключаясь между задачами, чувствуешь, что теряешь поток? Это проблема многих.

👉 Совет: прежде чем сменить задачу, потрать пару минут на запись текущего состояния. Напиши кратко: что ты сделал, что осталось, какие идеи у тебя есть. Когда вернёшься, тебе не придётся вспоминать всё с нуля — это экономит тонны времени и нервов.

Data Science | Machinelearning [ru]

07 Dec, 14:07


⚙️ Пишем сервис инференса ML-модели на go, на примере BERT-а

Статья объясняет, как внедрить ML-модель, обученную на Python, в сервис на Go, используя ONNX. Рассматривается пример работы с моделью seara/rubert-tiny2-russian-sentiment для анализа сентимента текста.

Читать...

Data Science | Machinelearning [ru]

07 Dec, 10:07


📝 Подборка вакансий для лидов

Team Lead IT отдела
Python, Django, FastAPI, Celery, PostgreSQL, Redis, JavaScript, Blazor wasm, ASP.NET, IdentityServer, Kafka, RabbitMQ
от 150 000 ₽ | от 3 лет

ML Engineer
Python, TensorFlow, PyTorch, Keras, SQL, Pandas, Jupyter Notebook, OpenAI GPT, LLaMA, Whisper, Google TTS, Amazon Polly, WebRTC, Zoom API, Google Calendar API, iCalendar, REST, GraphQL, MLOps, MLflow, DVC
от 1 000 до 2 000 $ | от 3 лет

Архитектор Решений / Solution Architect
Greenplum, Apache Spark, Apache Airflow, DWH, ETL, SQL, Python, Teradata, Hadoop, Apache NiFi, S3, Apache Spark Streaming
Уровень дохода не указан | от 3 лет

Data Science | Machinelearning [ru]

06 Dec, 14:07


🤖 Как мы сделали клиентскую поддержку интернет-магазина действительно умной: опыт внедрения RAG-бота

Статья описывает разработку «умного» помощника для клиентской поддержки интернет-магазина. Рассматриваются проблемы, с которыми сталкивался клиент, и пути их решения с помощью ИИ.

Читать...

Data Science | Machinelearning [ru]

06 Dec, 10:07


Пишите код быстрее и оставляйте больше времени на творчество вместе с AI-ассистентом разработчика

Устали от рутины? Отдайте ее AI!
Заходите на платформу GitVerse и пишите код вместе с AI-ассистентом GigaCode. Он поддерживает более 35 языков, умеет анализировать контекст, дописывать строки и функции в автоматическом и ручном режимах, а еще — писать код по комментариям и делать рефакторинг с помощью коротких команд. Всего за пару минут AI-помощник может оценить проект и трудозатраты на его создание.

Внутри AI есть функция CodeChat — с ней можно оптимизировать или отрефакторить имеющийся код, сгенерировать тесты и документацию, а также объяснить фрагмент кода. Задавать вопросы можно и по всему открытому файлу, и по конкретному фрагменту — просто выделите его в редакторе и сформулируйте запрос к CodeChat.

Хорошие новости — недавно GigaCode обновился и стал еще лучше справляться с задачами разработки: теперь наиболее вероятные продолжения кода будут генерироваться с учётом контекста всего проекта. Не забудьте обновить плагин GigaCode :)

Зарегистрироваться на GitVerse.

Data Science | Machinelearning [ru]

05 Dec, 18:07


📈 Подборка статей для вашей карьеры

• Как продакт-менеджеру учить английский: план, сроки, советы

• Иллюзия прогресса: почему мне не удалось дать студентам-айтишникам реальный опыт

• Interview copilots: как кандидаты используют ChatGPT на интервью

• Моя история входа в IT: как я ломал стены своих ограничений

• Как мы разработали систему грейдинга для системных аналитиков

Data Science | Machinelearning [ru]

05 Dec, 14:07


📝 Подборка вакансий для сеньоров

Аналитик данных / Data Analyst
SQL (Clickhouse, Postgres, MS SQL), Python, статистика, A/B тестирование, Jupyter Notebook, GIT, BI-системы (Datalens, Superset), ML-подходы
от 300 000 до 400 000 ₽ | от 3 лет

Senior Data Scientist (Recsys)
Python, PyTorch, машинное обучение, глубокое обучение, свёрточные нейросети, трансформеры
Уровень дохода не указан | Требуемый опыт не указан

Эксперт по безопасности инфраструктуры Big Data
Hadoop, Clickhouse, Kafka, Airflow, Zeppelin, Apache Ranger, IDM, k8s, деперсонализация данных, обфускация
Уровень дохода не указан | Требуемый опыт не указан

Senior Python developer (Evolution Openstack)
Python 3.10, PostgreSQL, SQLAlchemy, Linux, OpenStack, KVM, Ansible, RabbitMQ, Docker, Kubernetes
Уровень дохода не указан | от 3 лет

Data Science | Machinelearning [ru]

05 Dec, 10:07


Машинное обучение для начинающих: Введение в нейронные сети

Этот пост предназначен для абсолютных новичков и предполагает НУЛЕВЫЕ предварительные знания машинного обучения. Мы разберемся, как работают нейронные сети, и реализуем одну из них с нуля на Python.

Читать...

Data Science | Machinelearning [ru]

04 Dec, 18:07


➡️ DeepSeek AI: От инъекции промпта до захвата аккаунта

Статья рассказывает о новой AI-модели DeepSeek-R1-Lite, созданной для логических рассуждений. Рассматриваются её возможности, тестирование и перспективы применения в задачах анализа и вычислений.

Читать...

Data Science | Machinelearning [ru]

04 Dec, 10:07


➡️ Машинное обучение: Линейная регрессия. Теория и реализация. С нуля. На чистом Python

В этой статье я рассказываю про линейную регрессию, свойства, которыми должны обладать данные для модели, процесс обучения, регуляризацию, метрики качества. Кроме чистой теории я показываю как это все реализовать. Я рассказываю все в своем стиле и понимании - с инженерной точки зрения, с точки зрения того, как реализовывать с нуля.

Читать...

Data Science | Machinelearning [ru]

03 Dec, 18:07


📝 Подборка вакансий для мидлов

DevOps-инженер в Data Platform (Big Data)
Linux, Kubernetes, CI/CD
Уровень дохода не указан | от 3 лет

Data Analyst
Python, Apache Spark, SQL, Apache Hadoop
Уровень дохода не указан | от 2 лет

ML-инженер
Python, TensorFlow, PyTorch, Keras
Уровень дохода не указан | от 1 года

Middle Python Developer [Bridge]
Python, REST, Apache Kafka, RabbitMQ, Asyncio, AIOHTTP, ООП
Уровень дохода не указан | от 1 года

Data Science | Machinelearning [ru]

03 Dec, 10:07


⚙️ Physics-based и data-driven моделирование

Статья объясняет различия между физически обоснованными моделями и моделями, основанными на данных, с примерами задач машинного обучения. Рассматривается подход к обработке данных, выбору моделей и их обучению.

Читать...

Data Science | Machinelearning [ru]

02 Dec, 18:07


🔎 Подборка вакансий для джунов

Junior Data Analyst
🟢SQL, Python, BI-инструменты, математическая статистика, A/B-тестирование
🟢от 70 000 ₽ на руки | от 1 до 3 лет

Junior AI Engineer
🟢Python 3.x, PyTorch, TensorFlow, Pandas, NumPy, ETL, Reinforcement Learning, ChatGPT API, Английский язык (B2)
🟢от 1 000 до 1 500 $ до вычета налогов | от 1 до 3 лет

Python developer Junior+/Middle
🟢Python, Flask, Asyncio, Websockets, RabbitMQ, Docker, PostgreSQL, Clickhouse, Redis, Kafka, Kubernetes, Grafana, Celery, Prometheus
🟢Уровень дохода не указан | от 1 до 3 лет

Junior Data Analyst
🟢SQL, Python, Tableau, BI-системы, Английский язык (B1 и выше)
🟢Уровень дохода не указан | от 1 до 3 лет

Data Science | Machinelearning [ru]

02 Dec, 10:07


➡️ Машинное обучение: общие принципы и концепции

В этой статье я рассказываю про основные концепции, типы обучения, типы задач в машинном обучении и также делаю постановку задачи машинного обучения (МО). Все это я рассказываю в своем стиле и понимании.

Читать...

Data Science | Machinelearning [ru]

01 Dec, 18:07


🔥 Самые интересные статьи за последние дни:

• Реализация подобия Apple Vision Pro

• Почему LLM так плохо играют в шахматы (и что с этим делать)

• LLM будут врать вечно

• Как мы создали LLM-модель Cotype Nano

• Человек и LLM: как построить метрики для оценки моделей

Data Science | Machinelearning [ru]

01 Dec, 10:07


🤖 Псст, ИИ нужен? 5 полезных инструментов для разработчика

Статья предлагает подборку инструментов, платформ и шаблонов для работы с языковыми моделями и создания ИИ-ассистентов. Рассматриваются протестированные в МТС решения, упрощающие разработку и интеграцию.

Читать...

Data Science | Machinelearning [ru]

30 Nov, 18:07


🔎 Подборка зарубежных вакансий

Senior Data Engineer
🟢Python, Java, AWS, MS SQL
🟢от 4 000 до 6 000 $ до вычета налогов | от 3 до 6 лет

Data Engineer AI (удаленно)
🟢Python, DWH, SQL, ETL, PostgreSQL, Power BI
🟢от 2 200 до 3 400 $ на руки | от 1 до 3 лет

Senior Data Scientist
🟢RecSys, Uplift modeling, Churn prediction, LTV prediction, Forecasting, A/B тестирование, MLOps, SQL
🟢от 4 500 до 6 500 $ до вычета налогов | более 6 лет

Junior Consultant / German AI consulting company
🟢Английский язык, B2B маркетинг, Социальный маркетинг, Email маркетинг, Data Analysis, Python, Контент-маркетинг, B2B Продажи, Автоматизация, Нейронные сети, ChatGPT, Lean Startup, CRM,
🟢от 500 € на руки | от 1 до 3 лет

Data Science | Machinelearning [ru]

30 Nov, 14:07


🔍 Учись читать чужой код, как книгу

Работаешь над багом или новым функционалом, но каждый раз стопоришься на чужом коде? Это не только твоя боль — многим сложно понять чужую логику.

👉 Совет: подходи к коду как к истории. Читай, где начинается действие (инициализация), как развивается сюжет (основной алгоритм) и где развязка (возврат результата). Комментарии, даже редкие, — это подсказки от автора, используй их. Так ты научишься быстрее ориентироваться и даже предугадывать ошибки.

Data Science | Machinelearning [ru]

30 Nov, 10:07


📖 «Охота на электроовец: большая книга искусственного интеллекта» или как написать книгу про ИИ без регистрации и SMS

История о том, как за 6 лет я написал двухтомник, посвящённый искусственному интеллекту и машинному обучению.

Читать...

Data Science | Machinelearning [ru]

29 Nov, 18:07


📝 Подборка вакансий для лидов

Team Lead Data Scientist (кредитный скоринг)
Python, SQL, Scikit-learn, Pandas, NumPy, XGBoost, LightGBM, Matplotlib, Seaborn, Plotly
Уровень дохода не указан | от 3 лет

Ведущий аналитик
Microsoft Excel, Pandas, Tableau, PowerBI, SQL, Python, NumPy, SQLAlchemy
от 100 000 ₽ | опыт не указан

Team Lead
Java, Golang, Python, C++, .NET
Уровень дохода не указан | от 1,5 лет

QAA Lead в Сервис Транспорта
Python, Linux, Git, Docker
Уровень дохода не указан | от 5 лет

Data Science | Machinelearning [ru]

29 Nov, 10:07


💳 Как мы провели ИИ-трансформацию стратегических процессов Сбера

Статья рассказывает об ИИ-трансформации Сбера, включая ключевые задачи, такие как стресс-тестирование, анализ рынков и прогнозирование эффективности сотрудников. Рассматривается использование ИИ до и после трансформации.

Читать...

Data Science | Machinelearning [ru]

29 Nov, 07:27


Ищем DL-разработчика в Точку. Мы — финтех-компания, создаём онлайн-банк и более 60 сервисов для предпринимателей, которые делают их жизнь проще.

📍До 450 000 ₽, удалёнка по всему миру

Из крутого в Точке — свобода действовать. Никто не будет навязывать методы, трекать время и контролировать каждое действие. Если у тебя есть идеи, что можно улучшить — ты будешь услышан и сможешь влиять на процессы и стек.

Работать предстоит в команде RnD, которая занимается экспериментальными ML-проектами. Будешь следить за новыми методами, моделями и инструментами в ML, разворачивать и адаптировать их для задач разных команд Точки.

Больше о задачах и требованиях на сайте.

Data Science | Machinelearning [ru]

28 Nov, 18:07


📈 Подборка статей для вашей карьеры

• Больше чем книга

• Как поставить цель на обучение, чтобы дойти до конца

• Движение вверх: как стать CTO — на примере пяти историй ИТ-директоров

• Найм дизайнеров глазами лида

• Software Architect vs Solution Architect

Data Science | Machinelearning [ru]

28 Nov, 14:07


Хотите создавать идеальные C++ API, которые не ломаются на первой же нагрузке?

👉 Тогда не пропустите этот бесплатный вебинар! 3 декабря в 20:00 мск — открытый урок, который кардинально изменит ваш подход к проектированию API на C++!

**Что вас ждет?**
- Понимание плохого и хорошего API: как отличить чудовищное API от шедевра?
- Умение правильно именовать сущности и разбивать их на атомарные элементы. Прокачаем навыки, чтобы не было «кучи кода» и «головной боли».
- Идеи data-oriented подхода для создания API в высоконагруженных приложениях.

**Кому это будет полезно?**
- Разработчикам, кто только знакомится с C++ или переходит с других языков.
- C++-программистам, которые хотят прокачать свои навыки разработки API.

Вы научитесь проектировать удобный, стабильный и эффективный API для C++, который будет работать как часы.

⭐️ Спикер Андрей Рыжиков — разработчик в НИИ обработки аэрокосмических изображений.

Успейте записаться на открытый урок и получите скидку на большое обучение «C++ Developer».

Для участия зарегистрируйтесь: https://vk.cc/cFqnyx

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Data Science | Machinelearning [ru]

28 Nov, 14:07


📝 Подборка вакансий для сеньоров

Data Engineer
Python, SQL, pandas, PostgreSQL, Docker, Redis, ClickHouse, Airflow, Spark, Git, Django, Node.js, React, Kubernetes
Уровень дохода не указан | от 2 лет

Senior Data Scientist (Ценообразование)
Spark, Hadoop, S3
до 420 000 ₽ | опыт не указан

Data-аналитик (Senior)
SQL, DWH, PostgreSQL, ETL, Greenplum
Уровень дохода не указан | от 2 лет

Senior Data Scientist [NUUM]
Python, SQL, Машинное обучение
Уровень дохода не указан | опыт не указан

Data Science | Machinelearning [ru]

28 Nov, 10:07


🤖 Как удалить Excel навсегда: делегируем юнит-экономику на Wildberries нейронке

Статья объясняет, как нейросети помогают оптимизировать юнит-экономику продавцов на WB, особенно при работе с большим ассортиментом. Рассматриваются подходы к автоматизации анализа и принятию решений.

Читать...

Data Science | Machinelearning [ru]

27 Nov, 18:07


⚙️ KAN 2.0: Kolmogorov-Arnold Networks Meet Science

Статья представляет перевод работы о нейронных сетях на основе алгоритма Колмогорова-Арнольда (KAN). Рассматриваются новые исследования, связь с наукой и использование библиотеки pykan на Python для практических задач.

Читать...

Data Science | Machinelearning [ru]

27 Nov, 10:07


👀 Сравнение 30 фотореалистичных ИИ-изображений: Flux1.1 против SD3.5

В статье обсуждаются возможности Flux1.1 Pro и SD3.5 Large в генерации фотореалистичных изображений. Описаны различия моделей и их результаты после разделения команды разработчиков.

Читать...

Data Science | Machinelearning [ru]

26 Nov, 18:07


📝 Подборка вакансий для джунов

Data engineer (Python Hadoop Spark)
Python 3.8+, Hadoop, Hive, Spark (PySpark), Airflow, PostgreSQL, ClickHouse, Kubernetes
Уровень дохода не указан | от 2 лет

Data Engineer
Python или Scala, SQL, Apache Spark, CI/CD, Airflow
Уровень дохода не указан | от 1-2 лет

Data Analyst
SQL, PL/SQL, Oracle, Jira, Confluence
Уровень дохода не указан | от 3 лет

Разработчик AI
Python, Pandas, NumPy, SQL, LangChain, LlamaIndex, OpenAI API, RAG, Faiss, Qdrant, Chroma, Elasticsearch, Git
Уровень дохода не указан | от 1 года с LLM, от 3 лет с Python

Python Developer
Python, Django, Linux, PostgreSQL, Celery, Redis, Pandas, NumPy
до 250 000 ₽ | от 3 лет

Data Science | Machinelearning [ru]

23 Nov, 10:07


⚙️ Пишем свою Diffusion модель с нуля

Статья предлагает разобраться в устройстве Diffusion моделей, их математике и принципах работы. Автор делится простыми объяснениями, примерами кода и результатами генерации изображений на собственной модели.

Читать...

Data Science | Machinelearning [ru]

23 Nov, 06:07


Многие из вас знают, что ШАД - одна из сильнейших школ для подготовки специалистов по анализу данных

Однако попасть в ШАД не так просто, нужно иметь сильную математическую базу и успешно пройти все этапы отбора.

Shad Helper готовит студентов к поступлению в Школу Анализа Данных Яндекса, AI Masters и магистратуру по анализу данных. В школе в основном ведутся занятия по высшей математике и программированию.
Все преподаватели кандидаты и доктора наук из МГУ, МФТИ, ВШЭ.

2 декабря 2024 года запускается новый поток подготовки к ШАД

💎Все преподаватели кандидаты и доктора наук из МГУ, МФТИ, ВШЭ
💎Есть система скидок за хорошую успеваемость
💎Длительность курса: ~6 месяцев
💎Оплата курса еженедельная (можно остановить обучение в любой момент)
💎Регулярные персонализированные домашние задания
💎Работа в мини-группах
💎Есть умный чат бот для студентов ( на базе gpt4)

🔗 Ссылка на телеграм @shadhelper

🎁 Для подписчиков канала скидка 30% на первоначальный взнос по промокоду DEVSP30

Реклама. ООО "Школа высшей математики". ИНН: 9728100991
erid: 2VtzqwmcPtb

Data Science | Machinelearning [ru]

22 Nov, 18:07


📝 Подборка вакансий для лидов

TeamLead Data Analyst
Python, DWH, ClickHouse
до 5 000 $ | от 3 лет

Главный администратор данных (Chief Data Steward) [Governance]
Git, SQL, Apache Kafka, NoSQL, PostgreSQL
Уровень дохода не указан | опыт не указан

Аналитик данных, senior/lead
SQL, Python, Apache Airflow, ETL, DWH
Уровень дохода не указан | от 3 лет

Lead/Senior Automation QA (Python or Java)
Python, Linux, Java, CI/CD, Docker, Тестирование API, Тестирование UI, Разработка тест-кейсов
Уровень дохода не указан | от 4 лет

Ведущий питонист
Python, Django, PostgreSQL, Docker
от 150 000 до 250 000 ₽ | опыт не указан

Data Science | Machinelearning [ru]

22 Nov, 14:07


⚙️ Как обеспечить Data Quality терабайтов данных и зачем: опыт СИБУРа

Статья посвящена опыту СИБУРа в создании DQ-сервиса для обеспечения качества данных. Рассматриваются задачи DQ, архитектура решения и универсальные подходы, применимые для анализа данных в крупных компаниях.

Читать...

Data Science | Machinelearning [ru]

22 Nov, 10:07


📈 Подборка статей для вашей карьеры

• Мои Red-Flags при устройстве в IT-компании: Как не стать гребцом. Часть 2

• Как строить карьеру в корпорации

• История: работа в чешском Red Hat

• Циничные заметки о карьере в IT от «гейткипера»

• Моя петиция EB-1A на грин-карту талантов, одобренная с первой попытки

Data Science | Machinelearning [ru]

22 Nov, 06:07


Это — база по Machine Learning и Data Science, которая заменит вам сотни тг-каналов и сайтов. Фишка в том, что здесь опытные ML-специалисты первыми освещают новости сферы, пишут емкие разборы статей и делятся прикладными материалами.

И канал – только часть клада: ребята сделали целый сайт с научными лонгридами, ML-соревнованиями и свежими вакансиями индустрии.

Теперь вся жизнь ML-специалиста собрана в одном месте: Data Secrets

Data Science | Machinelearning [ru]

21 Nov, 18:07


📝 Подборка вакансий для сеньоров

Data engineer
SQL, Python, Apache Hadoop
Уровень дохода не указан | от 3 лет

Data Engineer
SQL, Python, Apache Airflow, Greenplum, Apache Spark
от 250 000 ₽ | от 2 лет

Senior Data Scientist
Python
Уровень дохода не указан | опыт не указан

ML-инженер
Машинное обучение, Deep Learning, Нейронные сети, Python, TensorFlow, PyTorch, Keras, Linux, Git, Docker
Уровень дохода не указан | опыт не указан

Разработчик БД (PostgreSQL, прикладные витрины)
SQL, PostgreSQL, ETL, Apache Airflow, Greenplum
Уровень дохода не указан | от 3 лет

Data Science | Machinelearning [ru]

21 Nov, 14:07


Приглашаем тебя на крутое IT-мероприятие, посвящённое AI и передовым технологиям разработки рекомендательных систем.

Регистрируйся, и в день мероприятия мы пришлём тебе ссылку на трансляцию. Или приходи очно, если ты живёшь в одном из городов.

Где и когда?

✔️ Владивосток, 26 ноября
✔️ Новосибирск, 28 ноября
✔️ Нижний Новгород, 5 декабря
✔️ Санкт-Петербург, 6 декабря

Тебя ждут крутейшие доклады, живая дискуссия и новые знания в сфере рекомендательных систем.

Количество мест ограничено — успей занять своё и прикоснуться к миру рекомендательных систем! 👌

Data Science | Machinelearning [ru]

21 Nov, 10:07


🤔 Размер имеет значение: как исторические данные помогают на этапе дизайна A/B-теста

Статья изучает применение метода CUPED в A/B-тестах для повышения чувствительности и сокращения выборок. Рассматривается его использование на этапе дизайна эксперимента без потери статистической мощности.

Читать...

Data Science | Machinelearning [ru]

20 Nov, 16:07


🔥 Самые интересные статьи за последние дни:

• Разбей и властвуй: как создать кастомный токенизатор в SpaCy

• Функция property() в Python: добавляем управляемые атрибуты в классы

• Что, если не трансформеры: какие альтернативы главной архитектуре нейросетей у нас есть в 2024 году

• cgroups и namespaces в Linux: как это работает?

• ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя

Data Science | Machinelearning [ru]

20 Nov, 14:07


💡 Хакатон «Норникеля» «Интеллектуальные горизонты»: стартуем на поиски инноваций!

Погружайся в кейсы от «Норникеля» и решай задачу по одному из трех треков: от анализа данных до автоматизации, от экологического мониторинга до создания алгоритмов, которые могут изменить правила игры в индустрии.

Когда: 6 - 8 декабря.
Формат: онлайн.
Призовой фонд: 1 500 000 рублей.

🧑‍💻 Разработчики, аналитики, инженеры и любители новаторских решений смогут применить свои знания, чтобы придумать решения для реальных задач в промышленности.

Хакатон «Норникеля» «Интеллектуальные горизонты» — это отличный шанс показать свои идеи, повлиять на промышленность и найти новых единомышленников. 

Если нет команды — поможем её собрать!

➡️ Регистрация открыта! Успей зарегистрироваться до 2 декабря, 23:59 МСК по ссылке.

Data Science | Machinelearning [ru]

20 Nov, 10:07


⚙️ Как я учился писать промпты для RAG пайплайна. Разбор 3-го места на AI Journey 24 E-com AI assistant

Статья описывает опыт создания RAG-пайплайна с использованием Gigachat API для участия в AI Journey. Автор делится инсайтами, полученными в процессе разработки ассистента для рекомендаций товаров, который занял 3-е место.

Читать...

Data Science | Machinelearning [ru]

20 Nov, 07:07


⚡️Всероссийский Хакатон ФИЦ 2024

🚀Попробуйте себя в одном из предложенных кейсов:
1. Семантический делитель текстов: Разработать алгоритм, который сможет обеспечить точное разделение текста на блоки.

2. Контекстный перевод названий научных работ: Разработать переводчик, который будет переводить названия научных работ.

3. Прогнозирование бизнес драйверов: Разработать решение для задачи прогнозирования временных рядов бизнес-драйверов.

4. Система контроля и управления доступом: Разработка системы контроля и управления доступом.

И др. 16 кейсов смотрите на сайте: https://фиц2024.рф/hackathon 

Хакатон пройдет в 2 этапа: Отборочный этап в Онлайн, Финал в Офлайн.

🏆Призовой фонд: 6 000 000 руб.
🔥Дедлайн регистрации: 26 ноября, 23:59
📅Даты отборочного этапа: 29 ноября - 2 декабря
🦾Даты финала: 3 - 4 декабря

Зарегистрируйтесь для участия в хакатоне: https://фиц2024.рф/hackathon

#реклама
О рекламодателе

Data Science | Machinelearning [ru]

19 Nov, 18:07


📝 Подборка вакансий для мидлов

Data Scientist
Python, SQL, MS SQL Server, PostgreSQL, A/B тестирование, ML-модели, Ad-Hoc аналитика
Уровень дохода не указан | Средний (Middle)

Data Scientist (Моделирование РБ)
Python, Spark, SQL, ML, DL, NLP, Apache Spark
Уровень дохода не указан | Средний (Middle)

ML Engineer / Инженер машинного обучения
Python, PyTorch, PostgreSQL, FastAPI, LLM, MLOps, Git, Docker, AirFlow
Уровень дохода не указан | Средний (Middle)

Python разработчик
Python, FastAPI, PostgreSQL, React
от 150 000 ₽ | Средний (Middle)

Python разработчик
Python, Flask, FastAPI, PostgreSQL, MySQL
Уровень дохода не указан | Средний (Middle)

Data Science | Machinelearning [ru]

19 Nov, 10:07


📊 ИИ в Крипто-Торговле: Возможен ли Успех?

Статья описывает процесс создания успешных ИИ-моделей для автоматизированной крипто-торговли на ByBit. Рассматриваются три стратегии, их разработка, оптимизация и результаты, превысившие убытки.

Читать...

Data Science | Machinelearning [ru]

18 Nov, 18:07


🔎 Подборка вакансий для джунов

Junior разработчик Python/Стажер (удаленно)
🟢Python, MongoDB, REST API, Bash, Linux, Git, FastAPI, Celery
🟢до 50 000 ₽ | 1–3 года

Младший инженер-программист (стажер)
🟢Python, JavaScript, API, Linux, Docker, IoT, Сетевые технологии, Базы данных
🟢Уровень дохода не указан | Без опыта

Junior Python developer
🟢Python, SQL, FastAPI, Aiohttp, PostgreSQL, MySQL, Docker, RabbitMQ, Kafka, SQLAlchemy
🟢Уровень дохода не указан | 1–3 года

Junior Data Analyst / Младший Аналитик
🟢SQL, Python, Power BI, Исследовательский анализ данных, Визуализация данных, Математическая статистика, Аналитика продаж, Бизнес-анализ
🟢от 70 000 до 100 000 ₽ | 1–3 года

Младший аналитик данных/Junior Data Analyst
🟢PostgreSQL, Airflow, Metabase, Clickhouse, Debezium, DataLens, SQL, Python
🟢Уровень дохода не указан | 1–3 года

Data Science | Machinelearning [ru]

18 Nov, 10:07


🔥 Дообучаем языковую модель GPT2 с помощью Torch

Статья углубляется в дообучение языковых моделей, используя DistilGPT2 на данных QuyenAnhDE/Diseases_Symptoms. Рассматривается процесс настройки модели для генерации симптомов на основе заболеваний, с возможностью расширения логики.

Читать...

Data Science | Machinelearning [ru]

18 Nov, 06:07


Почта на прокачку: как повысить защиту Microsoft Exchange и не слить чувствительные данные в сеть

Когда: 27 ноября, 11:00 по Москве
📍 Регистрируйтесь на вебинар!

SuperHardio time*! Чтобы узнать, как захардкорить самое ценное и построить настоящий лабиринт для хакера, присоединяйтесь к нашему новому образовательному проекту от ИТ-экспертов  Positive Technologies. 

В программе:

-  Что не так с типовой настройкой Microsoft Exchange 2019

- Топ-3 сценария уязвимостей

-  Как ИТ-специалисту справиться с  бременем ответственности за корректную работу почтового сервиса.

-  Поговорим про харденинг Microsoft Exchange 2019 и особенности подхода к повышению киберустойчивости

Вебинар будет полезен архитекторам, CIO, СТО, DevOps-экспертам и техническим специалистам разных профилей. Присоединяйтесь!

*Это как "Марио тайм", время героев-экспертов харденинга

Data Science | Machinelearning [ru]

17 Nov, 18:07


✔️ Big Data мертвы, да здравствуют Smart Data

Давайте рассмотрим концепцию Smart Data и выясним, действительно ли Big Data превращаются во что-то более интеллектуальное.

Читать...

Data Science | Machinelearning [ru]

17 Nov, 10:07


⚙️ Инфраструктура для Data-Engineer BI-tools

В этой статье я хотел бы показать куда уходят данные и что с ними происходит, когда пайплайны дата-инженеров заканчивают работу.

Читать...

Data Science | Machinelearning [ru]

16 Nov, 18:07


🔎 Подборка зарубежных вакансий

Продакт Разработчик Python AI (удаленно)
🟢Python, Node.js, React, PostgreSQL, JavaScript, TypeScript, Django Framework, Redux
🟢от 1 900 до 2 700 $ до вычета налогов | 3–6 лет

QA automation team lead (Python)
🟢Python, QA, BDD, Selenium
🟢до 4 000 $ до вычета налогов | 3–6 лет

Founding NLP/LLM/AI Engineer
🟢Python, LLM, NLP, AI, RAG, NER
🟢от 4 000 до 7 000 $ до вычета налогов | 3–6 лет

Senior Python Developer
🟢Python, Flask, REST, API, JavaScript, MySQL, GitHub, Celery, Django, Linux, PHP, Java, Django Framework, Bash, Redis, Frontend, Backend, REST API, PostgreSQL, Unit Testing, jQuery, Ansible, Clickhouse, Gitlab, FastAPI, RestAPI, SQL, Git
🟢Уровень дохода не указан | 3–6 лет

Senior DevOps Engineer
🟢Docker, Bash, Git, Английский язык, AWS, Kubernetes, Terraform, Jenkins, Gitlab, Grafana, ELK, Linux, Python
🟢от 6 000 до 7 000 $ на руки | более 6 лет

Data Science | Machinelearning [ru]

16 Nov, 10:07


🤔 Прогнозирование продаж с использованием библиотеки Prophet

Статья посвящена прогнозированию продаж FTTB-FMC для ежедневной отчетности. Рассматриваются подходы к анализу данных, ключевые KPI и методы, используемые для прогнозирования продаж в сегменте ШПД и конвергентных продуктов.

Читать...

Data Science | Machinelearning [ru]

15 Nov, 18:07


🔎 Подборка вакансий для лидов

Python Lead
🟢Python 3, FastAPI, Django, Streamlit, Pandas, Numpy, SciPy, PostgreSQL, Apache Kafka
🟢Уровень дохода не указан | 3–6 лет

Lead Python Developer
🟢Python, FastAPI
🟢Уровень дохода не указан | 3–6 лет

Data Analyst Team Lead
🟢SQL (PostgreSQL, Clickhouse), Python, Tableau
🟢Уровень дохода не указан | более 6 лет

Lead Data Engineer
🟢Scala, Python, SQL, ClickHouse, PostgreSQL, MySQL, Apache Spark, Apache Airflow, AWS S3, Kubernetes, Docker, GitLab CI, Tableau
🟢Уровень дохода не указан | более 6 лет

Python Backend Developer (AI)
🟢Python, Flask, SQL, Docker, AWS, Azure, GCP, Yandex.Cloud
🟢от 250 000 ₽ на руки | 3–6 лет

Data Science | Machinelearning [ru]

15 Nov, 15:07


🎓 Приглашаем вас на вебинар "Обучение с учителем: разбираем задачу классификации", который состоится 18.11.2024 в 18:00! 🕕

Занятие посвящено задачам классификации, которые востребованы во всех областях Data Science. На занятии обсудим, что представляет из себя этот тип задач, какие есть подходы для её решения, а также изучим алгоритм kNN и применим его на практике.

👉 В результате урока вы:
- познакомитесь с таким классом задач, как классификация;
- изучите метрики для задачи классификации;
- узнаете, как устроен алгоритм kNN;
- научитесь применять алгоритм kNN на практике.

🔥 Не упустите возможность углубить свои знания в области классификации и машинного обучения! 📊🤖

👉 Присоединяйтесь к нам: https://vk.cc/cEHdGr

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Data Science | Machinelearning [ru]

15 Nov, 14:07


🕵️‍♂️ Когда твоя работа зависит от Василия

Задача вроде простая, но всё стопорится, потому что «это знает только Василий, он тут со времён динозавров». Никакой документации, только магия в его голове. В итоге — пока он не ответит, ты зависаешь, а проект буксует. Звучит знакомо?

⚙️ Если так, пора разорвать этот порочный круг. Вместо бесконечных вопросов начни собирать всё в одну базу знаний — хоть в Notion, хоть на салфетках. Предложи команде попробовать парное программирование: пока Василий творит чудеса, ты уже разбираешься, как эти фокусы повторить.

Data Science | Machinelearning [ru]

15 Nov, 10:07


✔️ 30k аудиозаписей: наводим порядок

Статья рассказывает, как организовать и обработать огромный архив аудиозаписей дневников, созданных задолго до эпохи современных speech-to-text технологий. Рассматриваются инструменты и подходы для упорядочивания данных.

Читать...

Data Science | Machinelearning [ru]

15 Nov, 06:07


Как расти в Data Science: опыт Авито.

В новой статье команды data science-инженеров Авито собраны практические советы для тех, кто хочет вырасти от джуна до лида в Data Science. Ревью, знания и инициативность — что еще важно для карьерного успеха?

Читайте подробности по ссылке.

Реклама. ООО «Авито Тех».

Data Science | Machinelearning [ru]

14 Nov, 18:07


🔎 Подборка вакансий для сеньоров

Data Scientist / Дата сайентист
🟢Python, SQL, Git, Docker, Airflow
🟢от 250 000 до 300 000 ₽ на руки | 3–6 лет

Middle/Senior Python Developer
🟢Python, Django, FastAPI, Flask, PostgreSQL, MongoDB, Redis, AWS, Google Cloud, Microsoft Azure, Kafka, RabbitMQ
🟢Уровень дохода не указан | 1–3 года

Senior ML Engineer (NLP, TTS)
🟢Deep Learning, NLP, TTS, CV, Python
🟢до 15 000 $ на руки | более 6 лет

ML Engineer / Senior Data Scientist
🟢Python, PyTorch, TensorFlow, Airflow, PySpark, ONNX, NumPy, SQL, Docker
🟢Уровень дохода не указан | 3–6 лет

Data Analyst (Antifraud)
🟢Python, Pandas, NumPy, SciPy, ClickHouse, PostgreSQL, MySQL, Redash, Superset
🟢Уровень дохода не указан | 3–6 лет

Data Science | Machinelearning [ru]

14 Nov, 15:07


🚀 Приглашаем на бесплатный вебинар по C++! 🚀

Дата: 19 ноября 2024 года
Время: 20:00
Тема: Как протестировать C++ код и оценить степень собственной лени

На вебинаре поговорим о том, зачем разработчикам писать юнит-тесты, и какую пользу они несут. Посмотрим популярные фреймворки тестирования, такие как GTest и Boost, разберем несколько практических примеров. Затем попробуем оценить, достаточно ли тестов мы написали для своего кода.

На занятии:
1. Научимся подключать фреймворки тестирования к своему проекту при помощи CMake.
2. Напишем готовые к запуску тесты.
3. Поговорим о том, как измерить покрытие тестами кода, какие инструменты для этого существуют.

В результате:
1. Придем к тому, что вместе с кодом стоит сразу писать и юнит-тесты к нему.
2. В будущем с легкостью интегрируем любой фреймворк тестирования в свой проект.
3. Научимся не только писать тесты, но и мерить их покрытие.

👉🏻О курсе "Специализация C++ Developer" на Otus:
Длительность курса: 10 месяцев.
Формат: Онлайн.

Программа курса:
· Введение в язык C++: основы синтаксиса, структура программ, базовые конструкции.
· Классы и структуры: ООП, наследование, полиморфизм, шаблоны.
· Основы unit-тестирования: подключение фреймворков, написание тестов, измерение покрытия.
· Стандартная библиотека и полезные алгоритмы: контейнеры, ввод-вывод, алгоритмы.

📌Скидка 15%: действует до 17 ноября!

Не упустите шанс стать профессионалом в C++! Присоединяйтесь к вебинару и узнайте больше о курсе.
🔗 Регистрация на вебинар

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Data Science | Machinelearning [ru]

14 Nov, 12:07


🤖 Data Scientist / ML-специалист в Х5 Tech

В команде Х5 вас ждет:
— конкурентная зарплата, удаленка или гибридный формат;
— амбициозные проекты вроде собственной платформы по работе с нейросетями и автоматического ценообразования;
— прокачка навыков в корпоративном университете, митапы, конференции и общение с топами.

В зависимости от выбранной команды вы будете:
— генерировать тексты, настраивать чат-боты и работать с RAG-системами;
— заниматься классификацией и детекцией деталей на фото;
— разрабатывать рекомендательные системы.

Ожидаем, что вы:
— работаете в сфере Data Science или Machine Learning от трех лет;
— знаете Python;
— умеете работать с LLM, NLP, CV или RecSys (на выбор).

Откликнуться: @oooozhegovaaaa

Data Science | Machinelearning [ru]

14 Nov, 10:07


✔️ Как нейросети меняют работу дизайнеров

Статья раскрывает, как дизайнеры студии используют ИИ для усиления креативности в проектах. Обсуждаются инструменты и подходы, которые помогают сохранить индивидуальность и создать продуманный дизайн с помощью нейросетей.

Читать...

Data Science | Machinelearning [ru]

13 Nov, 18:07


🔥 Самые интересные статьи за последние дни:

• Не бойтесь потоков в Python, они не кусаются

• Рубрика: VPS на пределе возможностей. LLM на CPU с 12Gb RAM

• Предвзятость русскоязычных LLM: кого машина считает «обычным человеком»?

• Семантический веб: краткий обзор технологий и инструментов

• Инструмент обеспечения качества данных: от теории к практике

Data Science | Machinelearning [ru]

13 Nov, 10:07


🤖 Как развернуть LLM с помощью vLLM и TorchServe

Хочешь запустить большую языковую модель в продакшене, но не знаешь, как совместить простоту развертывания с промышленной надежностью? Комбинация vLLM и TorchServe решает эту задачу. Она обеспечивает как простой запуск, так и продвинутые возможности для масштабирования.

Читать...

Data Science | Machinelearning [ru]

12 Nov, 18:07


🔎 Подборка вакансий для мидлов

ML-инженер в IT-Хаб
🟢Python, PyTorch, Jax, TensorFlow, Linux, Git, Bash, Docker
🟢Уровень дохода не указан | 1–3 года

ML-инженер/engineer в финтех гигант
🟢Python, PyTorch, Jax, TensorFlow, Linux, Git, Bash, Docker
🟢Уровень дохода не указан | 1–3 года

Python-разработчик
🟢Python, REST API, gRPC, GraphQL, PostgreSQL, MongoDB, Linux, Docker, CI/CD
🟢Уровень дохода не указан | 3–6 лет

Middle Data Scientist MLE
🟢Python (numpy, scipy, pandas, sklearn, catboost, pytorch), SQL (Clickhouse, PostgreSQL)
🟢от 200 000 до 350 000 ₽ | 1–3 года

Middle Data инженер
🟢Python, SQL, PostgreSQL, ClickHouse, Apache Airflow, dbt, Docker, Git
🟢Уровень дохода не указан | от 1 года

Data Science | Machinelearning [ru]

12 Nov, 10:07


⚙️ Умножение троичных матриц для нейросетей

Статья исследует использование троичных значений (-1, 0, 1) в нейросетевых матрицах. Рассматриваются методы хранения тритов с использованием 32-битной арифметики и подходы к их быстрому умножению через оптимизацию памяти.

Читать...

Data Science | Machinelearning [ru]

11 Nov, 18:07


🔎 Подборка вакансий для джунов

Backend-тестировщик-программист (Python)
🟢Python, Swagger, REST API, JMeter, Postman, TMS, Git, Linux, Docker, CI/CD
🟢Уровень дохода не указан | Опыт 1–3 года

Аналитик данных / Data analyst (junior)
🟢SQL, Python, DataLens, Tableau, Power BI, Jupyter Notebook
🟢до 120 000 ₽ | Опыт 1–3 года

Junior Data Engineer
🟢SQL, Python, PySpark, Airflow, PostgreSQL, Git, Yandex Cloud
🟢до 120 000 ₽ | Опыт 1–3 года

AI-разработчик junior
🟢Python, Keras, TensorFlow, PyTorch, Git, Linux
🟢от 30 000 до 40 000 ₽ | Без опыта

Junior Python Backend Developer
🟢Python, ROS, Docker, GitLab, Jira, Confluence, Ubuntu
🟢Уровень дохода не указан | Опыт 1–3 года

Data Science | Machinelearning [ru]

11 Nov, 15:07


⁉️ Столкнулись с тормозящим кодом?

Асинхронность и потоки в Python — это два инструмента, которые могут сделать ваши программы быстрее, но где же разница? Если вам важно оптимизировать выполнение запросов и IO-операций, не пропустите бесплатный открытый урок 12 ноября в 20:00 мск!

Мы рассмотрим вытесняющую и кооперативную многозадачность, обсудим процессы и потоки на уровне ОС. Вы узнаете, что такое race conditions и как их избежать, а также получите практическое понимание, как работает asyncio в Python.

👨‍💻🛠👨🏻‍💻 Урок для Python-разработчиков, Data Scientists и ML-инженеров, которые работают с базами данных, API и многозадачностью.

🔴 Запишитесь на урок и получите скидку на курс «Python для аналитики»: https://vk.cc/cEwxZ1

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Data Science | Machinelearning [ru]

11 Nov, 10:07


🖥 Руководство по созданию приложения для поиска данных на основе агента GraphRAG

Статья описывает приложение, объединяющее GraphRAG и AutoGen-агентов с локальными LLM от Ollama для автономного встраивания и вывода. Рассмотрены ключевые аспекты: интеграция знаний, настройка LLM, вызов функций и интерактивный интерфейс.

Читать...

Data Science | Machinelearning [ru]

10 Nov, 20:07


🔥 Самые интересные статьи за последние дни:

• KAN: Kolmogorov–Arnold Networks

• Стандартное отклонение для полных чайников

• Почему галлюцинируют нейросети [и что с этим делают]

• Понимает ли Vision Llama импрессионистов?

• Что ищет он в краю далёком? Как найти смысл жизни с PostgreSQL

Data Science | Machinelearning [ru]

10 Nov, 16:07


Открытый урок для разработчиков баз данных, системных администраторов и аналитиков

📒Тема:
Сложности при работе с данными

📕Рассмотрим:
- Какие бывают проблемы, возникающие при работе с некорректными данными.
- Как эффективно обрабатывать данные с ошибками ввода.
- Практические примеры очистки данных в SQL.

📗Результат:
- Научитесь использовать алгоритмы для поиска и исправления ошибок в записях.
- Сможете эффективно устранять дублирующие записи и стандартизировать данные в базе.
- Усвоите основные подходы к автоматизации очистки данных и повышению их точности.

📘Спикер:
Анастасия Чекушина — опытный разработчик и преподаватель, .net developer + lead.

Встречаемся 11 ноября в 20:00 мск. Всем участникам дадим скидку на основной курс.

👉 Регистрируйтесь прямо сейчас, чтобы не пропустить бесплатный урок: https://clck.ru/3EUsb8

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Data Science | Machinelearning [ru]

10 Nov, 10:07


➡️ Путь разметки данных для NER: от Open Source до Prodigy

Статья посвящена созданию обучающей выборки для NER. Описан опыт разметки данных с использованием Open Source инструментов и Prodigy, профессионального решения для ускорения процесса создания наборов данных.

Читать...

Data Science | Machinelearning [ru]

09 Nov, 18:07


🔎 Подборка валютных вакансий

Middle/Senior Python Developer
🟢Python 3, Django, SQL, NoSQL, Git, Agile
🟢От 2 000 до 3 000 $ | Требуемый опыт: 3–6 лет

Python Developer (Senior/Middle)
🟢Python, Django, VueJS, PostgreSQL, Git, Linux, JavaScript
🟢От 1 200 $ | Требуемый опыт: 3–6 лет

Senior Backend Developer - Python
🟢Python, PostgreSQL, Redis, FastAPI, Flask, Pyramid, SQLAlchemy, Celery, AWS
🟢От 4 000 $ | Требуемый опыт: более 6 лет

Программист Python (нейросети)
🟢Python, искусственный интеллект
🟢От 500 Br | Требуемый опыт: 1–3 года

ML-инженер для разработки переводчика
🟢Python, PyTorch, Scikit-learn, Numpy, FastAPI, NLP, трансформеры (BERT, GPT, Claude), Git
🟢От 1 000 $ | Требуемый опыт: 1–3 года

Data Science | Machinelearning [ru]

09 Nov, 14:07


😱 Страх ошибки — худший тормоз для роста.

Сколько раз ты избегал нового только потому, что боялся облажаться? Ошибка кажется концом света, но на деле это просто этап обучения. Сидя в зоне уверенности, ты никогда не узнаешь, насколько можешь быть сильнее, умнее, опытнее.

🎯 Что делать: начни с маленьких рисков. Возьми задачу, в которой пока не уверен, или предложи идею на митинге, даже если есть сомнения. Фейлы — это не клеймо, а возможность показать, как ты умеешь справляться и двигаться дальше. Чем раньше примешь это, тем быстрее начнёшь расти.

Data Science | Machinelearning [ru]

09 Nov, 10:07


🤔 Практика: мой опыт интеграции более 50 нейронных сетей в один проект

Статья основана на полутора годах работы по внедрению нейронных сетей в веб-приложение с открытым исходным кодом. В ней собраны практические лайфхаки для решения реальных задач и преодоления сложностей, с которыми сталкиваются разработчики.

Читать...

Data Science | Machinelearning [ru]

08 Nov, 18:07


🔎 Подборка вакансий для лидов

Team Lead Python
🟢Python, Django, Flask, RabbitMQ, Redis, nginx, uwsgi, haproxy, GitLab CI/CD, AWS Thinkbox Deadline
🟢от 350 000 ₽ | 3–6 лет

Team Lead (Python)
🟢Python, FastAPI, SQLAlchemy, PostgreSQL, MongoDB, MeiliSearch, TypeSense, Docker Swarm, Kubernetes, pytest, unittest, Sentry, CI/CD
🟢Уровень дохода не указан | более 6 лет

Tech lead Senior Python developer, релокация в Дубай
🟢Python, PostgreSQL, MySQL
🟢от 6 000 до 8 000 $ | более 6 лет

Tech Lead Python Developer (Внешние интеграции)
🟢Python, FastAPI, Sanic, PostgreSQL, asyncpg, RabbitMQ, aio_pika, Redis
🟢Уровень дохода не указан | 3–6 лет

Lead ML Engineer (Python)
🟢Python, TensorFlow, PyTorch, spaCy, NLTK, Docker, Kubernetes, GitLab, Jenkins
🟢Уровень дохода не указан | 3–6 лет

Data Science | Machinelearning [ru]

08 Nov, 11:07


👩‍💻 Разрабатываем первое AI приложение

Статья анализирует роль языка и цифровизации в накоплении и передаче знаний. Обсуждаются вызовы структурирования данных, которые, несмотря на успехи машинного обучения и реляционных баз, всё ещё затрудняют полное понимание накопленной информации.

Читать...

Data Science | Machinelearning [ru]

08 Nov, 07:17


⁉️ Хотите понять, чем отличается асинхронная работа python-кода от многопоточной?

Не пропустите бесплатный открытый урок 12 ноября в 20:00 мск! Мы рассмотрим вытесняющую и кооперативную многозадачность, обсудим процессы и потоки на уровне ОС. Вы узнаете, что такое race conditions и как их избежать, а также получите практическое понимание, как работает asyncio в Python.

👨‍💻🛠👨🏻‍💻 Урок для аналитиков, для Python-разработчиков, Data Scientists и ML-инженеров, которые работают с базами данных, API и многозадачностью.

🔴 Запишитесь на урок и получите скидку на курс «Python для аналитики»: https://vk.cc/cEhbMa

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Data Science | Machinelearning [ru]

07 Nov, 18:07


📈 Подборка статей для вашей карьеры

• Пришёл на вакансию дизайнера, а стал питонистом: как IT-специалисты нашли свою первую работу

• На сколько денег может рассчитывать ИТ-предприниматель в разных ветках развития

• Анализ задачи с собеседования в Google: конь и телефонные кнопки

• Быстрый старт в QA Fullstack: чем вооружиться будущему стажеру в Альфа-Банке

• Как убить самоорганизацию в команде: вредные советы для лидера

Data Science | Machinelearning [ru]

07 Nov, 14:07


🔎 Подборка вакансий для сеньоров

Senior backend developer - Python
🟢Python, PostgreSQL, Redis, FastAPI, Flask, Pyramid, SQLAlchemy, Celery, pydantic
🟢от 4 000 $ | 3–6 лет

Backend Python Developer (FastAPI, Highload)
🟢Python 3.10-3.12, FastAPI, PostgreSQL, Redis, Docker, GraphQL, Kafka, Airflow, Elasticsearch
🟢до 390 000 ₽ | 3–6 лет

Разработчик Python (Django, DRF)
🟢Python, Django, DRF, PostgreSQL, SQL, CSS, Git, RabbitMQ
🟢150 000 – 220 000 ₽ | 3–6 лет

Data Scientist (middle/senior)
🟢Python, Spark, SQL, Machine Learning, pandas, PySpark, Hadoop, Hive, Big Data
🟢до 450 000 ₽ | 3–6 лет

Senior Data Engineer
🟢Python, SQL, Apache Kafka, DWH, OLAP, Greenplum, Clickhouse, Airflow
🟢350 000 – 450 000 ₽ | от 4 лет

Data Science | Machinelearning [ru]

07 Nov, 10:07


🤔 3750 дней разработки AI или почему боты всё ещё не захватили покер

Статья рассматривает создание AI для покера (Техасского безлимитного холдема) и анализирует его сложность как модели бизнес-отношений. Обсуждаются метрики и стратегии, которые игроки используют в изменяющемся контексте для принятия решений.

Читать...

Data Science | Machinelearning [ru]

06 Nov, 18:07


➡️ Семантическая сегментация: самый полный гайд 2024

Статья раскрывает, как семантическая сегментация помогает машинам «видеть», разбивая изображение на классы объектов. Обсуждаются её применение в автономных авто, медицине и обработке спутниковых снимков для точного распознавания контекста.

Читать...

Data Science | Machinelearning [ru]

06 Nov, 17:17


🤖 Яндекс открыл доступ к новому поколению своих языковых моделей

YandexGPT 4 Pro и YandexGPT 4 Lite теперь доступны через API в Yandex Cloud. Обновленные модели справляются с более сложными запросами, работают с расширенным контекстом и поддерживают скрытые рассуждения, а также вызов функций для работы с внешними инструментами. Качество ответов значительно улучшено: YandexGPT 4 Pro в 70% случаев отвечает лучше предыдущей версии, а YandexGPT 4 Lite не уступает самой мощной модели прошлого поколения.

Алексей Долотов, руководитель продуктов ML в Yandex Cloud, и Андрей Бут, руководитель команды YandexGPT Alignment рассказали в новой статье на Хабре про обучение YandexGPT 4 и ее отличия от предыдущих версий.

Читать…

Data Science | Machinelearning [ru]

05 Nov, 18:07


🔎 Подборка вакансий для мидлов

Data Engineer middle
🟢Python, Spark, Hadoop, Hive, Airflow, SQLAlchemy, PostgreSQL, Docker, GitLab, CI/CD, Linux
🟢от 190 000 до 270 000 ₽ | от 1 года

Data Engineer (middle)
🟢SQL, Greenplum, FormIT, Informatica, Cloud infrastructure, Yandex Cloud, IaaS, PaaS
🟢от 230 000 до 250 000 ₽ | 3–6 лет

Python-разработчик (middle, AI)
🟢Python, TensorFlow, Keras, PyTorch, scikit-learn, PostgreSQL, MongoDB, Redis, SQLAlchemy, Celery, RabbitMQ, Kafka, Docker, Google Cloud
🟢от 180 000 до 250 000 ₽ | 1–3 года

Python Developer (Middle/Middle+)
🟢Python, Django, PostgreSQL, Celery, Docker, REST, Git
🟢от 120 000 ₽ | 3–6 лет

Middle Python Developer: Backend / Server side
🟢Python, FastAPI, Flask, MariaDB, PostgreSQL, MongoDB, ElasticSearch, Docker, K8S, Git, CI/CD
🟢от 3 000 до 4 000 $ | 3–6 лет

Data Science | Machinelearning [ru]

05 Nov, 10:07


👩‍💻 FlexiPrompt: Удобное создание динамических промптов в Python

Статья знакомит с FlexiPrompt — лёгкой библиотекой для генерации промптов в Python при работе с языковыми моделями. Рассмотрены её преимущества: быстрая интеграция, гибкая настройка диалога и возможность создания нескольких агентов в одной LLM.

Читать...

Data Science | Machinelearning [ru]

04 Nov, 18:07


🔎 Подборка вакансий для джунов

Python-разработчик (Junior)
🟢Python, SQL, PyCharm, Django Rest Framework, GitHub
🟢от 60 000 ₽ | Без опыта

Junior Python разработчик
🟢Python, API, PostgreSQL, MySQL, NoSQL
🟢от 30 000 до 50 000 ₽ | Без опыта

Python-разработчик (Junior)
🟢Python, SQL, FastAPI, Flask, Linux, Docker, Git, Gitlab
🟢от 75 000 ₽ | Без опыта

Разработчик нейросетевых алгоритмов/Reinforcement Learning
🟢Python, PyTorch, TensorFlow, Reinforcement Learning
🟢от 60 000 ₽ | Без опыта

Junior Data Scientist
🟢SQL, Python, Clickhouse, Apache Airflow, MS Excel, HTML
🟢Уровень дохода не указан | Без опыта

Data Science | Machinelearning [ru]

04 Nov, 10:07


⚙️ Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Продолжение

Статья продолжает разбор моделирования температурного временного ряда с двойной сезонностью. Основное внимание уделено подбору оптимальных параметров сезонной модели САРПСС для точного описания данных.

Читать...

Data Science | Machinelearning [ru]

03 Nov, 18:07


🔥 Самые интересные статьи за последние дни:

• Пишем Wake-on-LAN сервис на ESP8266 при помощи ChatGPT

• Необычные вкусы покупателей: что такое товарные пары и как их исследовать

• Сгенерированный ИИ код сделает вас плохим программистом

• Словари в Python: обзор и как пользоваться

• Поиск жулика: Как понять, что перед вами ChatGPT 4?

Data Science | Machinelearning [ru]

03 Nov, 10:07


🛍 Как базовые знания кодинга и нейросетей сэкономили нам больше 15 млн ₽ на Wildberries [скрины]

Статья раскрывает процесс полной автоматизации создания карточек товаров для маркетплейсов, используя нейросети, Photoshop и немного креативного подхода. Описаны практические методы, которые экономят тысячи рублей на огромном ассортименте.

Читать...

Data Science | Machinelearning [ru]

02 Nov, 18:07


🔎 Подборка валютных вакансий

Разработчик операций AI, Python/React
🟢Python, React, PostgreSQL, Aiogram, GPT
🟢от 800 до 1 300 USD (до вычета налогов) | 1–3 года

Senior Software Engineer (Python)
🟢Python, FastAPI, TypeScript, Node.js, React, MongoDB, PostgreSQL, RabbitMQ, Kafka, Redis, Docker, Kubernetes, AWS, Google Cloud
🟢от 2 500 до 3 500 USD (до вычета налогов) | 3–6 лет

Middle Backend Developer (Python)
🟢Python, FastAPI, Tornado, PostgreSQL, SQLAlchemy, Redis, RabbitMQ, Docker, nginx, gitlab-ci
🟢от 2 000 до 3 300 USD (до вычета налогов) | 3–6 лет

Senior Backend Developer - Python
🟢Python, PostgreSQL, Redis, FastAPI, Flask, Pyramid, SQLAlchemy, Celery, pydantic, AWS
🟢от 4 000 USD на руки | 3–6 лет

Python Fullstack Developer
🟢Python 3, FastAPI, Redis, SQL (MySQL, MariaDB), Docker, Grafana, PHP, TypeScript, React
🟢до 3 000 USD на руки | 1–3 года

Data Science | Machinelearning [ru]

02 Nov, 14:07


💭 Скорость — не главный показатель успеха. Гораздо важнее — чёткое понимание, куда ты идёшь.

Многие тратят кучу энергии, чтобы везде поспеть: освоить новое, прокачать скиллы, закрыть дедлайны. Но часто за спешкой скрывается отсутствие направления. И пока ты гонишься за всем сразу, фокус на том, что действительно важно, ускользает.

🎯 Что делать: раз в месяц выдели время на анализ — какие задачи реально приближают тебя к целям, а какие тянут энергию впустую? Подумай, что можно делегировать, что автоматизировать, а от чего отказаться. Сосредоточься на главном, и почувствуешь, что каждое действие наконец работает на твой рост.

Data Science | Machinelearning [ru]

02 Nov, 10:07


✔️ Простой и быстрый тест LLM для прототипа: сравниваем 16 open-source-моделей на запросе с разной температурой

В статье рассказывается, как быстро протестировать 16 LLM для создания текстовых прототипов, даже если вы не в теме ML. Берём несколько моделей, сравниваем результаты, оцениваем, подходит ли под задачу.

Читать...

Data Science | Machinelearning [ru]

01 Nov, 18:07


🔎 Подборка вакансий для лидов

Team Lead backend/Python (remote)
🟢Python (синхронный и асинхронный), Pyramid, AIOHttp, SQLAlchemy, Redis, Docker, Pytest, Alembic, PostgreSQL, Vue.js
🟢Уровень дохода не указан | Опыт от 3 лет

Python Team Lead
🟢Python, Django Rest Framework, SQL, NoSQL, Celery, Docker, RabbitMQ, управление командой
🟢от 250 000 ₽ | Опыт 3–6 лет

Python-разработчик Machine Learning / Computer Vision
🟢Python, TensorFlow, PyTorch, Keras, Scikit-learn, Pandas, AWS, SQL (PostgreSQL), Apache Spark, Apache Kafka, Apache Airflow
🟢от 400 000 ₽ | Опыт 3–6 лет

Senior/Lead Backend Developer (Python)
🟢Python3, Asyncio, SQL, PostgreSQL, FastAPI, Redis, Docker, Temporal, RabbitMQ, Linux, Elasticsearch
🟢до 450 000 ₽ | Опыт 3–6 лет

Tech Lead (python)
🟢Python 3.11, MySQL, Clickhouse, Redis, Aiogram, Aiohttp, Docker-compose, Nginx, GitHub
🟢от 250 000 ₽ | Опыт более 6 лет

Data Science | Machinelearning [ru]

01 Nov, 10:07


➡️ ИИ в логистике: отслеживаем транспортные средства на производственной территории с помощью нейросети

В статье описан путь от пет-проекта до системы для трекинга транспорта: нейросети, компьютерное зрение и инструменты, позволяющие «видеть» и анализировать производственные процессы.

Читать...

Data Science | Machinelearning [ru]

31 Oct, 18:07


📈 Подборка статей для вашей карьеры

• В какой момент профессия программиста свернула не туда?

• Офис Intel в Израиле отменил бесплатный кофе

• Войти в IT – в 37 и с дипломом филфака

• Путь к мастерству: Как стать успешным разработчиком

• Галера от HH или джуны по-дешевке

Data Science | Machinelearning [ru]

31 Oct, 15:17


Яндекс в шестой раз вручил научную премию в области машинного обучения Yandex ML Prize. Ее получили 14 ученых, которые представили перспективные работы в области генеративных моделей, обработки естественного языка, компьютерного зрения, информационного поиска и когнитивной робототехники.

Сегодня я хотел бы рассказать вам о паре наиболее интересных на мой взгляд работ, чьи авторы были удостоены премии. Так, команда под руководством Артёма Лыкова из Сколтеха создала универсальную когнитивную систему для различных типов роботов и представила робота-собаку, которая понимает человеческую речь. Эти разработки могут стать основой для технологии «роя умных роботов», способных автономно выполнять задачи в строительстве, геологоразведке и астрономии.

Исследования еще одного лауреата, Алексея Скрынника из AIRI, касаются обучаемых децентрализованных решений, что улучшит подходы к многоагентной навигации, включая складскую логистику. Он фокусируется на обеспечении эффективного взаимодействия между агентами (роботами и техникой), что повышает гибкость и автономность их работы.

Помимо самой премии, лауреаты получат доступ к Яндекс 360 и грант на использование Yandex Cloud, что поможет им проводить объёмные вычисления и анализировать данные.

Data Science | Machinelearning [ru]

31 Oct, 14:07


🔎 Подборка вакансий для сеньоров

Senior Python Developer (Highload, Crypto)
🟢Python 3.10-3.12, FastAPI, PostgreSQL, Redis, MongoDB, Pydantic, SQLAlchemy, Alembic
🟢до 500 000 ₽ | более 6 лет

Python Developer (Senior)
🟢Python, asyncio, aiohttp, FastAPI, PostgreSQL, Redis, Cassandra, Kafka, RabbitMQ, ElasticSearch, ClickHouse
🟢от 360 000 до 480 000 ₽ | 3–6 лет

Senior Python-разработчик
🟢Python, FastAPI, RabbitMQ, Kubernetes, PostgreSQL, asyncio, Alembic, Docker, SQLAlchemy, Git, CI/CD, S3, Airflow
🟢до 500 000 ₽ | более 6 лет

Senior Machine Learning Engineer (Computer Vision)
🟢Python, PyTorch, OpenCV, Scikit-Image, FFmpeg
🟢от 600 000 ₽ | 3–6 лет

Senior/Middle Data Scientist
🟢Python, SQL, классический ML, anti-fraud системы
🟢Уровень дохода не указан | 3–6 лет

Data Science | Machinelearning [ru]

31 Oct, 10:07


👀 Распознавание ж/д пикетных столбиков по фотографиям с беспилотника на основе PyTorch и YOLOv5

Статья раскрывает процесс использования БПЛА и нейросетей для точного распознавания объектов на ортофотопланах. Описаны этапы подготовки данных, разметки и обучения сети на примере поиска пикетных столбиков на ж/д перегонах. Исходный код доступен на GitHub.

Читать...

Data Science | Machinelearning [ru]

31 Oct, 06:07


🐘 Открытый урок для начинающих и опытных разработчиков баз данных, системных администраторов и аналитиков

Тема:
DML: вставка, обновление, удаление, выборка данных в PostgreSQL. Управление данными в PostgreSQL.

Рассмотрим:
- Операции вставки, обновления и удаления данных с использованием SQL-запросов.
- Эффективные методы работы с выборками данных и сложными подзапросами.
- Как обеспечить целостность данных при изменениях в базе.

Спикер Анастасия Чекушина — опытный разработчик и преподаватель, .net developer + lead.

Встречаемся 31 октября в 20:00 мск. Всем участникам дадим скидку на основной курс.

👉 Регистрируйтесь прямо сейчас, чтобы не пропустить бесплатный урок: https://otus.pw/D5Lj/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Data Science | Machinelearning [ru]

30 Oct, 18:07


🔥 Самые интересные статьи за последние дни:

• Всё, что вы хотели знать о Django Channels

• Сборка Python проекта с uv и Docker

• DE-1. DIY ассистент на LLM

• Ваши генераторные выражения сломаны: чиним и разбираемся

• Всё, что вы хотели знать о Django Channels

Data Science | Machinelearning [ru]

30 Oct, 15:07


Чтобы расти в профессии и брать на себя новые роли, нужно не бояться пробовать новое. Например, новое обучение.

Если попробовать курс бесплатно, можно проверить, подходит ли он вам. Тогда пробовать новое уже не так страшно.

Практикум собрал большую экспертизу Яндекса: на курсах вы освоите новые скилы на практике, получите обратную связь от опытной команды и пополните ваше портфолио.

Вот несколько наших курсов:
Мидл Python-разработчик
Мидл Java-разработчик
Мидл Android-разработчик
Мидл фронтенд-разработчик

Получите скидку 20% после прохождения первой темы любого курса. Она бесплатная 🔥

Data Science | Machinelearning [ru]

30 Oct, 10:07


⚙️ Под микроскопом: AI Product Hack

Статья анализирует результаты AI Product Hack, рассматривая спорное судейство и кейс компании Raft по мониторингу токсичного контента в AI-продуктах. Исследуются риски и последствия неконтролируемого поведения LLM в реальных проектах.

Читать...

Data Science | Machinelearning [ru]

30 Oct, 06:37


Avito ML Cup — это соревнование для ML-инженеров и специалистов в области Data Science, где предстоит создать модель для рекомендаций на основе полусинтетических данных.

🚀Старт: 5 ноября
🔥Призовой фонд: 600 000 рублей.

Участвовать можно как индивидуально, так и в команде до 4 человек. Предлагаемые решения проверяются автоматически по метрике ROC-AUC, а результат будет виден в лидерборде.

Регистрация уже началась, не пропустите возможность! Подробности ➡️ по ссылке.

Data Science | Machinelearning [ru]

29 Oct, 18:07


🔎 Подборка вакансий для мидлов

Разработчик Python (Middle)
🟢Python, Django, Django Rest Framework, Git, MongoDB, Linux
🟢от 90 000 до 150 000 ₽ | 1–3 года

Middle Python Developer
🟢Python, FastAPI, SQLAlchemy, PostgreSQL, MongoDB, Redis, Docker, GNU/Linux
🟢от 120 000 до 180 000 ₽ | 3–6 лета

Middle Python разработчик
🟢Python, aiohttp, FastAPI, PostgreSQL, MongoDB, RabbitMQ, Kafka, NumPy, OpenCV
🟢от 140 000 до 240 000 ₽ до вычета налогов | 3–6 лет

Data Engineer/Дата инженер (ученик)
🟢Python, SQL, Big Data, MLflow, NoSQL, machine learning, Hadoop, Apache Spark, Scala, Apache Kafka
🟢от 100 000 до 110 000 ₽ | Без опыта

Data Engineer / Дата-инженер
🟢Python, PySpark, SQL, Azure (ADF, SQL DB), Databricks, Power BI, Azure DevOps
🟢от 190 000 ₽ до вычета налогов | 1–3 года

Data Science | Machinelearning [ru]

29 Oct, 15:07


Недавно была продлена квалификация на чемпионат по программированию Yandex Cup для ML-направления. А теперь вышла новость про увеличение призового фонда состязания с 12,5 до 16 млн рублей. Все дополнительные деньги разделятся между участниками-финалистами в направлении машинного обучения — в нём теперь заявлено 22 призовых места вместо шести.

Увеличение призового фонда — часть инициативы по развитию ML-технологий. Наглядный пример, как можно вкладываться в людей, развивая сферу в целом.

Data Science | Machinelearning [ru]

29 Oct, 10:07


🤔 Насколько хороши LLM?

Статья описывает создание и адаптацию бенчмарка для оценки русскоязычных LLM в российском контексте. Основное внимание уделено подбору вопросов, актуализации содержания и корректировке оценок для соответствия современным общественным реалиям.

Читать...

Data Science | Machinelearning [ru]

29 Oct, 06:07


Поговорим про деньги в IT?

Приглашаем опытных IT-специалистов пройти небольшой опрос про зарплаты и бенефиты в технологических компаниях. Это займёт не более 7 минут — а ваше мнение поможет одному крупному российскому работодателю делать актуальные оферы.

Пройти опрос можно здесь

Data Science | Machinelearning [ru]

28 Oct, 18:07


🔎 Подборка вакансий для джунов

Стажер Python Back-end (офис)
🟢Python, Git, PostgreSQL, SQL, Linux, JavaScript
🟢Уровень дохода не указан | Без опыта

Junior Data Engineer
🟢SQL, Big Data, DWH, ETL, Airflow, Python
🟢до 130 000 ₽ | 1–3 года

Junior Python developer
🟢Python, SQL/NoSQL, BeautifulSoup, requests, pandas, Selenium, Playwright, FastAPI, pytest, unittest, Docker
🟢от 70 000 ₽ | 1–3 года

Python-разработчик (Junior - Middle)
🟢Python, Django, MySQL, Django REST Framework, Linux, Git, Vue.js, HTML, CSS
🟢от 70 000 ₽ | 1–3 года

Junior Data Analyst / Data Analyst
🟢SQL, Atlassian Jira, Atlassian Confluence
🟢от 60 000 до 110 000 ₽ | 1–3 года

Data Science | Machinelearning [ru]

28 Oct, 10:07


⚙️ Как мы создаём Visionatrix: упрощая ComfyUI

В этой статье мы расскажем о нашем опыте работы с ComfyUI и разработке Visionatrix — надстройки, которая упрощает генерацию медиа. Мы обсудим ключевые проблемы, с которыми сталкиваются пользователи, наш подход к их решению, а также вкратце поделимся тем, как мы использовали ChatGPT и Claude для ускорения разработки в условиях ограниченного времени.

Читать...

Data Science | Machinelearning [ru]

28 Oct, 08:08


Как ускорить обучение нейросетей и обработку данных?
 
С помощью мощных видеокарт GPU: RTX 2080Ti и  RTX 4090. Они подойдут для решения  сложных графических задач, обучения нейросетей и выполнения сложных вычислений в области ИИ
 
Арендовать и потестить эти видеокарты можно в Selectel — одном из ведущих российских провайдеров ИТ-инфраструктуры.
 
Что вы сможете при аренде облачного сервера с GPU в Selectel:
● Получить ресурсы для обучения ML-моделей
● Платить только за время использования — почасовая ставка от 29 рублей
● Использовать лучшее железо — к вашим услугам процессоры с частотами 2,4-2,6 Ггц
● Масштабироваться без проблем — мгновенный переезд на более мощную видеокарту
● Выбирать из широкого ассортимента GPU-карт — доступно 9 моделей под самые разные задачи
● Чувствовать себя спокойно — предоставляем бесплатную защиту от DDoS-атак.
 
Арендовать серверы с почасовой оплатой

Data Science | Machinelearning [ru]

27 Oct, 18:07


➡️ Самые интересные статьи за последние дни:

• Эксперимент: даём ChatGPT полный доступ к компьютеру

• Правильный путь создания python-библиотеки: от создания до публикации

• Запускаем Yolo на пятирублёвой монете или Luckfox Pico Mini

• Более мощное семейство моделей YandexGPT 4: рост качества ответов, длинный контекст, пошаговые рассуждения

• Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито

Data Science | Machinelearning [ru]

27 Oct, 10:07


👩‍💻 Под капотом asyncio: принципы работы и ключевые концепции

Библиотека asyncio предоставляет полный набор инструментов для организации параллельного выполнения кода в Python с использованием концепции асинхронности. Но как на самом деле работает asyncio? Давайте разберемся в ключевых принципах и понятиях.

Читать...

Data Science | Machinelearning [ru]

26 Oct, 18:07


🔎 Подборка валютных вакансий

Data Engineer (Дата инженер)
🟢Stack: Python, SQL, Amazon Web Services, GCP, Azure
🟢от 2 500 до 5 500 $ | 3–6 лет

Data Engineer AI (удаленно)
🟢Python, DWH, PostgreSQL, CRM, ERP, SQL, ETL, Power BI, ML
🟢от 2 200 до 3 400 $ | 3–6 лет

Senior backend developer - Python
🟢Python, PostgreSQL, Redis, FastAPI, Flask, Pyramid, SQLAlchemy, Celery, Pydantic, AWS
🟢от 4 000 $ | Более 6 лет

QA manual/Продакт Разработчик операций AI
🟢Python, SQL, Aiogram, GPT, PostgreSQL, CRM
🟢от 800 до 1 300 $ | 1–3 года

Data Science | Machinelearning [ru]

26 Oct, 14:07


💡 Карьера — это не про «идеальную работу», а про опыт и умение адаптироваться

В мире, где всё меняется быстрее, чем ты успеваешь обновлять резюме, держаться за одну карьерную траекторию — всё равно что пытаться угнаться за горизонтом. Умение перестраиваться, пробовать новое и брать на себя задачи, которые немного пугают, — вот что реально важно. И это не про «выйди из зоны комфорта», а про осознанный выбор расти и не цепляться за привычное.

🎯 Что делать: пообщайся с коллегой из другой области, возьми на себя один проект вне своей зоны, попробуй новый инструмент или язык, устрой «ревизию» навыков — что сейчас реально работает на тебя, а что пора обновить? Простые шаги, но каждый — ключ к росту и новым возможностям.

Data Science | Machinelearning [ru]

26 Oct, 10:07


⚙️ Оценка LLM: метрики, фреймворки и лучшие практики

Статья объясняет, почему оценка LLM важна для бизнеса: модели ИИ не всегда достигают цели и нуждаются в доработке. Разбираются ключевые метрики, инструменты и лучшие практики для повышения надежности и точности.

Читать...

Data Science | Machinelearning [ru]

26 Oct, 06:07


🎃 Приглашаем на вебинар перед Хэллоуином: «Нужна ли математика на собеседованиях🧙‍♀️

Темные тучи сгущаются, и в воздухе витает мистическая атмосфера... Готовы ли вы окунуться в мир загадочной математики и раскрыть тайны успешного собеседования? Тогда ждем вас 28 октября в 20:00! 🕸
https://proglib.io/w/2d4a7398

Что вас ждет в эту зловещую ночь:

💀 Ошибаться не страшно: узнаем, как неудачные проекты и опыт «в стол» превращают джуниоров в сеньоров. Расскажем истории о том, как ошибки закаляют и помогают достигать вершин мастерства.

🧛 Собеседования без подготовки? Обсудим, возможно ли пройти через испытания рекрутеров без специальной подготовки или это путь в лабиринт с привидениями.

🧙 Теория и практика — зелье успеха:

• Выбор метрики оценки модели: какую метрику показать бизнесу, чтобы не столкнуться с гневом нечисти? Разберемся в разнице между MAPE и WAPE и когда какую применять.

• Трансформация распределений: как превратить логнормальное распределение в нормальное без волшебной палочки? Поговорим о том, зачем это нужно и как обойтись изменением функции потерь вместо магических превращений.

🦇 Бонус для смельчаков: раскроем секреты тестирования в маркетинге, которые помогут не заблудиться в темном лесу конкурентного рынка.

Не упустите шанс провести вечер в компании единомышленников, погрузиться в атмосферу Хэллоуина и получить ценные знания!

🕯 Записывайтесь на вебинар и готовьтесь к мистическим открытиям!
https://proglib.io/w/2d4a7398 👻

Реклама. ИП Дрёмов Артём Сергеевич, ИНН 771391651571. Erid 2Vtzqx3tvHr

Data Science | Machinelearning [ru]

25 Oct, 18:07


🔎 Подборка вакансий для лидов

Data Science Lead
🟢Pandas, SciPy, Scikit-learn, Seaborn, Grafana, PowerBI, SQL
🟢Уровень дохода не указан | 3–6 лет

Data Science Lead
🟢MLOps, Hadoop, Python, TensorFlow, PyTorch, R
🟢Уровень дохода не указан | 3–6 лет

Data Science Tech Lead
🟢Python, Apache Spark, Gen AI, Chat GPT
🟢Уровень дохода не указан | 3–6 лет

Tech Lead Python
🟢Python, FastAPI, Flask, Django, NoSQL
🟢Уровень дохода не указан | Более 6 лет

Tech Lead (Python)
🟢Python, Linux, Nginx, Docker, Asyncio, aiohttp, Squid
🟢Уровень дохода не указан | 3–6 лет

Data Science | Machinelearning [ru]

25 Oct, 10:07


🤔 Grok-2 в деле: Способен ли ИИ от Илона Маска превзойти конкурентов?

В середине августа мы видели анонс бета-версий Grok-2 и Grok-2 mini от стартапа Илона Маска xAI. Что ж, на дворе осень, как пел Anacondaz "на улице дубак, на сердце тлен и мрак", так пусть же Grok 2 сегодня станет тем самым, кто укроет зацензуренным пледом наши тела. Предлагаю начинать.

Читать...

Data Science | Machinelearning [ru]

25 Oct, 06:07


Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней.

Ближайшее мероприятие:

• 9-11 ноября — для продуктовых и аналитиков данных, офер за 3 дня в команды Финтеха и Яндекс Практикума.

Зарегистрироваться

Data Science | Machinelearning [ru]

24 Oct, 18:07


📈 Подборка статей для вашей карьеры

• Продуктивность и почему «сделать много всего» — это не про неё

• Куда выйти из айти?

• Как я боролся с выгоранием в ИТ: лайфхаки и личный опыт

• ИТ-пенсионеры и где они обитают

• Почему мне нужно, чтобы ты вкатился в айти

Data Science | Machinelearning [ru]

24 Oct, 14:07


🔎 Подборка вакансий для сеньоров

Data Scientist (Ranking&Search)
🟢Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch
🟢Уровень дохода не указан | 3–6 лет

Senior Data Analyst
🟢SQL, Python, LTV, CPA, RevShare, Tableau
🟢от 3 000 до 3 500 $ | 3–6 лет

Senior Data Scientist MLE
🟢ml, Python, Numpy, SciPy, pandas, sklearn, Clickhouse, PostgreSQL
🟢от 250 000 до 400 000 ₽ | 3–6 лет

Python developer (Middle\Senior)
🟢Python, Flask, FastAPI, PostgreSQL, ClickHouse, Airflow, Docker, Git
🟢Уровень дохода не указан | 3–6 лет

Python-разработчик (middle+,senior)
🟢Python, C++, ML, CI/CD, Docker, SMPL
🟢от 150 000 до 250 000 ₽ | 3–6 лет

Data Science | Machinelearning [ru]

24 Oct, 10:07


👩‍💻 7 малоизвестных возможностей стандартной библиотеки Python

Стандартная библиотека Python – это кладезь возможностей. Мы представляем семь недооцененных модулей, которые помогут вам улучшить организацию данных, оптимизировать производительность и упростить распространение ваших программ.

Читать...

Data Science | Machinelearning [ru]

24 Oct, 07:07


Яндекс продлил этап Квалификации на международный чемпионат по программированию Yandex Cup 2024 для ML-направления.

В этом году участники погрузятся в древние эпохи и попробуют решить задачи цивилизаций прошлого с точки зрения IT.

На картинках — примеры ситуаций, с которыми предстоит справиться: настроить систему разгрузки драккаров в порту викингов, помочь композитору в создании алгоритма для написания музыки, придумать систему архивации табличек астрономов династии Хань или помочь роботам пройти лабиринт Майя.

Принять участие могут начинающие и опытные разработчики со всего мира.

Регистрация на ML-трек доступна до 4 ноября.

Data Science | Machinelearning [ru]

23 Oct, 18:07


🔝 Самые интересные статьи за последние дни:

• Как я с помощью нейросетей обогнала инфляцию [4 кейса, скрины, никакой рекламы]

• Сравнение роста заработных плат ректората МГТУ им. Н.Э. Баумана и остальных сотрудников

• Pydantic 2: Полное руководство для Python-разработчиков — от основ до продвинутых техник

• SOLID на котиках

• Как переподписка по CPU в облаке снижает производительность Arenadata DB: результаты, которых не ждёшь

Data Science | Machinelearning [ru]

23 Oct, 10:07


🚀 Оптимизируй свой AI: разоблачение 6 мифов о работе с векторами в Pgvector

Шесть заблуждений, которые мешают тебе использовать всю мощь векторных баз данных в AI. Развенчав эти мифы, ты сможешь раскрыть истинный потенциал векторов и значительно повысить эффективность твоих AI-проектов.

Читать...

Data Science | Machinelearning [ru]

22 Oct, 18:07


🔎 Подборка вакансий для мидлов

Junior Python Developer
🟢Python, Linux, SQL, Django
🟢от 50 000 ₽ | Без опыта

Data Scientist
🟢Python (OpenCV, NumPy, Pandas, PyTorch), SQL, Triton Inference Server, TensorRT, Docker, Kubernetes, Helm
🟢до 80 000 ₽ | Без опыта

ML-инженер (ML Engineer / Data Scientist)
🟢Python, SQL, TensorFlow, PyTorch
🟢Уровень дохода не указан | 1–3 года

Data scientist (Junior)
🟢Python, SQL
🟢до 2 000 Br | 1–3 года

Data Scientist (Junior)
🟢Python, Numpy, PyTorch, SQL
🟢от 600 $ | Без опыта

Data Science | Machinelearning [ru]

22 Oct, 06:08


⚡️ Открыта регистрация на конкурс «Автономный поиск. Софт»

Создайте решение для поиска пропавших людей и поборитесь за призовой фонд в 25 миллионов рублей!

Когда: загрузить решение для возможности участия в финале необходимо до 8 ноября 23:59 МСК

Формат: онлайн

Призовой фонд: 25.000.000 рублей

🔥 Этот конкурс для вас, если вы хотите:

– прокачать свои навыки в Machine Learning и Computer Vision;

– внести вклад в решение важной социальной проблемы;

– заявить о себе и найти потенциальных партнёров, заказчиков или инвесторов;

– протестировать свои разработки на реальной инфраструктуре.

❗️Участникам предстоит разработать решение для поиска пропавших людей с использованием аэрофотоснимков, сделанных с беспилотных воздушных судов (БВС).

🔹 У вас будет возможность испытать свои решения на реальной инфраструктуре и получить шанс пройти проверку в условиях, близких к реальной поисковой операции!

▶️ Конкурс проводится Фондом НТИ совместно с МФТИ и ЛизаАлерт.

🕰Подать заявку можно до 2 ноября 2024 (23:59 МСК) по ссылке.

Data Science | Machinelearning [ru]

21 Oct, 18:07


🔎 Подборка вакансий для джунов

Junior Data Engineer
🟢Python (Pandas), SQL (Snowflake, Redshift), Git, CI/CD, Jenkins
🟢Уровень дохода не указан | 1–3 года

Junior Full Stack Analyst
🟢Jira, Confluence
🟢Уровень дохода не указан | Без опыта

Data Engineer/Стажер-разработчик DWH/ETL/Big Data
🟢DWH, Data Lake, ETL, SQL
🟢Уровень дохода не указан | Без опыта

Младший специалист отдела разработки (Python) / Специалист по парсингу данных
🟢Python 3, Django/Celery, PostgreSQL, HTML
🟢Уровень дохода не указан | 1–3 года

Junior AI Developer
🟢Python 3, LLM, ChatGPT
🟢от 50 000 до 80 000 ₽ | Без опыта

Data Science | Machinelearning [ru]

21 Oct, 10:07


↗️ Как я с помощью нейросетей обогнала инфляцию

В статье рассказывается, как использовать нейросети для оптимизации работы, если ваш доход в рублях, а расходы — в валюте. Спойлер: полное делегирование задач ИИ — миф, но с его помощью можно значительно упростить рутину и повысить продуктивность. Поделены реальные кейсы из жизни автора.

Читать...

Data Science | Machinelearning [ru]

21 Oct, 06:04


Яндекс Игры пришли к нам с запросом:


SELECT *
FROM subscribers
WHERE channel_name = 'devsp'
AND technical_skills IN ('SQL', 'Airflow', 'MapReduce', 'DataLens')
AND data_driven_approach = true
AND analytical_mindset = true
AND years_of_experience >= 2
AND fit = true;


Ребята ищут аналитика в свою команду. Яндекс Игры посещают более 40 млн пользователей в месяц, поэтому можно проверять кучу гипотез на крупных выборках и экспериментировать.

ВАЖНО. Проверенные гипотезы не пойдут «в стол», а будут помогать команде принимать взвешенные решения и влиять на развитие продукта.

Если у тебя есть опыт работы с продуктами, аналитический склад ума и необходимые навыки, — это отличный шанс быстро вырасти и прокачаться на интересных задачах.

Описание вакансии здесь, но лучше сразу пишите рекрутеру и договаривайтесь о собеседовании: @danny_md1

Data Science | Machinelearning [ru]

20 Oct, 18:07


🌞 Автоэнкодеры простыми словами

Автоэнкодеры являются базовой техникой машинного обучения и искусственного интеллекта, на основе которой строятся более сложные модели, например, в диффузионных моделях, таких как Stable Diffusion. Что же такое автоэнкодер?

Читать...

Data Science | Machinelearning [ru]

20 Oct, 14:07


🤖 LLaMator: Red Teaming фреймворк для тестирования уязвимостей LLM

В статье команда LLaMaстеры (студенты ИТМО AI Talent Hub) расскажет о создании LLaMator — фреймворка для тестирования уязвимостей интеллектуальных систем на базе больших языковых моделей, который победил на AI Product Hack.

Читать...

Data Science | Machinelearning [ru]

20 Oct, 10:07


✔️ От Павлова до ChatGPT: как LLM перевернули наше понимание мышления

В этой статье мы отправимся в захватывающее путешествие от классических теорий Павлова до передовых разработок в области ИИ. Мы раскроем тайны человеческого мышления, узнаем, как работают современные языковые модели, и поразмышляем о том, сможет ли искусственный интеллект когда-нибудь по-настоящему "понимать" нас.

Читать...

Data Science | Machinelearning [ru]

19 Oct, 18:07


👀 Анализ тональности текста: зачем он нужен и как его использовать? Объясняем за 7 минут

Как компании выявляют эмоции в тысячах отзывов и комментариев? Почему одни маркетинговые кампании становятся невероятным успехом, а другие — провалом? Сегодня мы подробно разберем, как анализ тональности работает в реальных кейсах, и покажем, как вы можете внедрить его для достижения своих бизнес-целей.

Читать...

Data Science | Machinelearning [ru]

19 Oct, 14:07


🧩 Реализация паттерна «Одиночка» на Python

Мечтаешь о коде, который работает как швейцарские часы? Паттерн «Одиночка» может стать тем самым механизмом, который заставит все шестеренки крутиться идеально.

Читать...

Data Science | Machinelearning [ru]

19 Oct, 10:07


🛠 4 полезных инструмента для работы с ИИ: RAGFlow, The Pipe, UFO и SWE-agent

В этой статье мы рассмотрим 4 ИИ-инструмента, которые расширяют возможности разработчика: от платформ для работы с документами до агентов, способных исправлять ошибки в коде.

Читать...

Data Science | Machinelearning [ru]

18 Oct, 18:07


🤔 Метрологический дефицит в бигдате: что это такое и как с ним бороться

Статья объяснит, почему данные, используемые в ИИ и машинном обучении, часто искажаются преобразованиями. Обсудим измерительные приборы, их влияние на производственные процессы и важность понимания этого эффекта.

Читать...

Data Science | Machinelearning [ru]

18 Oct, 14:07


➡️ Как мы перенесли распознавание на базе ИИ в веб и изменили веб-банкинг? В Markswebb оценили

Статья расскажет о ежегодном рейтинге лучших веб-версий банковских приложений 2024 года от Markswebb. Лидеры рейтинга использовали ИИ-решения Smart Engines для улучшения клиентского опыта и достижения рекордов.

Читать...

Data Science | Machinelearning [ru]

18 Oct, 10:07


⚙️ AILink для Wolfram и плагины для ChatGPT

Статья расскажет, как с помощью Wolfram Language создать ассистента на базе OpenAI API и добавить плагины. Также рассматривается удобство работы в интерактивном блокноте и обход региональных блокировок OpenAI. (197 символов)

Читать...

Data Science | Machinelearning [ru]

18 Oct, 07:08


Вебинар: «Как построить pipeline предобработки данных для машинного обучения»

📅 Дата: 21 октября 2024, 18:00 (МСК)
👩‍💻 Спикер: Мария Тихонова

🚀 О чем поговорим:
На вебинаре вы научитесь строить полноценный pipeline для подготовки данных под задачи машинного обучения. Мы обсудим ключевые шаги, такие как Exploratory Data Analysis (EDA) и предобработка данных, на конкретных примерах.

💼 Что вы получите:
- Разберетесь, как проводить разведочный анализ данных (EDA).
- Изучите лучшие практики по очистке, трансформации и подготовке данных для ML-моделей.
- Поймете, как избежать типичных ошибок при работе с данными.

📌 Встречаемся в преддверии старта курса «Machine Learning. Basic». Все участники вебинара получат специальную цену на обучение!

👉 Для участия зарегистрируйтесь на сайте: https://otus.pw/mkVE/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Data Science | Machinelearning [ru]

17 Oct, 18:07


😎 Искусство аугментации: как улучшить модели компьютерного зрения без сбора новых данных

В статье рассказывается о методе аугментации данных для улучшения работы моделей компьютерного зрения. Вы узнаете, как с помощью этого метода увеличить количество данных, повысить точность модели и избежать типичных ошибок.

Читать...

Data Science | Machinelearning [ru]

17 Oct, 14:07


Как Лента формирует эффективный ассортимент на основе данных

В этой статье расскажу про путь к управлению ассортиментом на основе данных и наш флагман – приложение Deli – рабочее место, в котором менеджер анализирует матрицу своих категорий и вносит в нее изменения на основе рекомендаций алгоритма.

Читать...

Data Science | Machinelearning [ru]

17 Oct, 10:07


🖥 Транскрибируем аудио и создаём субтитры для видео с помощью Whisper, FFmpeg и Python

В этом пошаговом гайде вы узнаете, как быстро автоматизировать процесс транскрибации и добавления субтитров к видео за считанные минуты.

Читать...

Data Science | Machinelearning [ru]

16 Oct, 18:07


⚙️ Построим GPT: с нуля и шаг за шагом

В этой статье я построил GPT архитектуру на данных из произведений Шекспира и получил достаточно впечатляющие результаты.

Читать...

Data Science | Machinelearning [ru]

16 Oct, 10:07


🔈 От звука к смыслу: распознавание речи в видеоконтенте

В данной статье мы рассмотрим проект по распознаванию речи из видео, преимущества и недостатки данной разработки, а также посмотрим на то, как ее внедрение помогло ускорить работу аналитиков и разработчиков на проекте.

Читать...

Data Science | Machinelearning [ru]

16 Oct, 06:17


NLP Researchers, отметьте в календаре 26 октября🌟

Всего за один день вы сможете пройти все этапы отбора, познакомиться с командой GigaCode и получить оффер.
Мы создаем AI ассистента разработчика – GigaCode. Наши модели помогают писать 80к строк кода ежедневно! Решаем задачи по различным подходам в NLP и PLP, проводим ресёрч-эксперименты и обучаем новые SOTA LLM.
В работе используем: NLP, DL, ML, Python, Pytorch, Transformers, FSDP, Deepspeed.

Чем предстоит заниматься?
реализовывать дизайн экспериментов, формулировать гипотезы для улучшения NLP/PLP моделей и алгоритмов, планировать исследовательские эксперименты с выводами.
проводить эксперименты, писать код, подготавливать датасеты и бенчмарки, проводить замеры и анализ результатов.
обучать модели на кластере, включая обучение моделей с нуля и дообучение опенсорс моделей.

Если вы амбициозны и готовы к новым вызовам в PLP и/или NLP направлениях, регистрируйтесь на One Day Offer!

Будем делать важнейшие исследования вместе!💚

Data Science | Machinelearning [ru]

15 Oct, 18:07


⚙️ 6 основных алгоритмов машинного обучения: руководство для начинающих

В этой статье мы расскажем о шести основных алгоритмах машинного обучения и их практическом применении в различных отраслях.

Читать...

Data Science | Machinelearning [ru]

15 Oct, 14:07


🎓 5 задач для подготовки к собеседованию по Python

Используем алгоритмы Манакера и заметающей прямой, определяем границы окна с k-элементами, вычисляем площадь участков разного цвета и находим наибольшую увеличивающуюся подпоследовательность.

Читать...

Data Science | Machinelearning [ru]

15 Oct, 10:07


🤖 42 секунды и 5 запросов: как взламывают генеративные ИИ-модели

Ты знал, что злоумышленникам для взлома генеративных ИИ достаточно всего 42 секунды и пяти запросов? В этой статье мы разберем, как это происходит, какие уязвимости существуют и как защитить свои системы от подобных атак.

Читать...

Data Science | Machinelearning [ru]

14 Oct, 18:07


🤔 В чём различия между Data Science, машинным обучением, ИИ, глубоким обучением и Data Mining

Эта статья поможет вам не только понять, какие исследования и опыт позволяют извлекать знания из данных, чтобы делать машины умнее, но и как конкретно это происходит.

Читать...

Data Science | Machinelearning [ru]

14 Oct, 14:07


☁️ Как обучить ИИ в облаке

Сегодня мы хотим поделиться с вами нашим успешным кейсом, который наглядно демонстрирует, как облачные технологии могут значительно улучшить и ускорить процессы разработки и обучения ИИ.

Читать...

Data Science | Machinelearning [ru]

14 Oct, 10:07


📨 Пример использования программы для парсинга e-mail адресов с сайтов, созданный ИИ

Сегодня делимся программой для парсинга e-mail с сайтов, созданной за 30 минут с помощью ИИ от Rokitok. Это показывает, как ИИ ускоряет задачи, на которые раньше уходили дни или большие бюджеты.

Читать...

Data Science | Machinelearning [ru]

13 Oct, 18:07


➡️ Что такое технология TTS, как устроена и каких сферах используется синтез речи

Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере.

Читать...

Data Science | Machinelearning [ru]

26 Sep, 17:11


🧐Что такое Sampling method и как он работает в моделях нейросети Stable Diffusion

В этой статье мы рассмотрим метод выборки (sampling method) в генеративных моделях, таких как Stable Diffusion или FLUX.

Читать...

Data Science | Machinelearning [ru]

26 Sep, 12:07


😎DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion

Новая обучающая структура для генерации анимируемых 3D-аватаров из текста.

Ядро этой структуры лежит в скелетно-управляемой перегонке оценок и гибридном 3D-представлении гауссова аватара.

В частности, предлагаемая скелетно-управляемая перегонка оценок интегрирует элементы управления скелета из 3D-шаблонов человека в 2D-модели диффузии, повышая согласованность надзора SDS с точки зрения вида и позы человека.

Это облегчает генерацию высококачественных аватаров, смягчая такие проблемы, как множественные лица, дополнительные конечности и размытие.

Обширные эксперименты показывают, что DreamWaltz-G очень эффективен в создании и анимации 3D-аватаров, превосходя существующие методы как по визуальному качеству, так и по выразительности анимации.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться

Data Science | Machinelearning [ru]

25 Sep, 17:24


🖥 Самые интересные статьи за последние дни:

• От промптов к дообучению: четыре уровня адаптации open-source моделей

• Обнаружение DGA доменов или тестовое задание на позицию intern ML-engineer

• Полный гид по бенчмаркам LLM

Data Science | Machinelearning [ru]

25 Sep, 12:07


🤙Полный гид по бенчмаркам LLM

В этой статье мы рассмотрим подробный каталог бенчмарков, разбитый на категории по сложности, динамике, целям оценки, спецификациям конечных задач и типам рисков.

Читать...

Data Science | Machinelearning [ru]

25 Sep, 10:38


Хотите узнать, как улучшить производительность вашего PostgreSQL-сервера и создавать собственные расширения?

Ждём вас на открытом уроке уже сегодня в 20:00 мск, где мы разберем:

- архитектуру PostgreSQL-сервера и влияние параметров конфигурации на использование памяти;
- роль планировщика и как тонкий тюнинг базы данных может повысить производительность;
- как создать собственное расширение и использовать pg_plan_inspector для оптимизации high-load развертываний.

Встречаемся в преддверии старта курса «PostgreSQL. Advanced». Все участники вебинара получат специальную цену на обучение!

👉 Регистрируйтесь прямо сейчас, чтобы не пропустить мероприятие: https://otus.pw/6Zsv/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Data Science | Machinelearning [ru]

24 Sep, 17:07


😎Обнаружение DGA доменов или тестовое задание на позицию intern ML-engineer

В этой статье мы рассмотрим простую задачу, которая используется одной компанией в качестве тестового задания для стажеров на позицию ML-engineer.

Читать...

Data Science | Machinelearning [ru]

24 Sep, 12:07


🔒Шифруй то, шифруй это, или LLM под замком

В этой статье мы поговорим о безопасном обращении с коммерческим контентом, шифровании данных, моделях и подходах к безопасному обращению и встраиванию коммерческих данных в модель.

Читать...

Data Science | Machinelearning [ru]

23 Sep, 17:07


🤩От промптов к дообучению: четыре уровня адаптации open-source моделей

В этой статье расскажу, как мы разделяем разные уровни адаптации, что делаем на каждом из них и когда переходим на следующий.

Читать...

Data Science | Machinelearning [ru]

23 Sep, 12:07


👥 Как мы генерируем GPT-нейросетями миллиарды объявлений на малом количестве GPU

В этой статье автор рассказывает о соединении тяжёлых процессингов и GPU‑вычислений. Как реализовали высоконагруженный процессинг, который обрабатывает миллиарды товаров и превращает их в объявления, используя тяжёлые модели, такие как YandexGPT, DSSM, CatBoost и другие. Оказывается, связать тяжёлый процессинг и инференс моделей вполне реально, даже когда нагрузка в процессинге превышает возможности вашего сервиса.

Читать…

Data Science | Machinelearning [ru]

22 Sep, 17:07


🖥 Самые интересные статьи за последние дни:

• Quantinuum о своём прогрессе в создании квантового ИИ

• Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM

• Встречаем нейроредактор в Браузере, или Как мы учили LLM-модели помогать пользователям с текстами

Data Science | Machinelearning [ru]

22 Sep, 12:07


🤩о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Читать...

Data Science | Machinelearning [ru]

21 Sep, 17:08


🤖Quantinuum о своём прогрессе в создании квантового ИИ

В статье о том, как квантовые компьютеры могут изменить наше понимание и применение ИИ.

Читать...

Data Science | Machinelearning [ru]

21 Sep, 12:07


🔍Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM

В этой статье автор расскажет, как быстро получить приемлемое качество, когда базовые подходы не помогают.

Читать...

Data Science | Machinelearning [ru]

20 Sep, 17:09


🌐Встречаем нейроредактор в Браузере, или Как мы учили LLM-модели помогать пользователям с текстами

В этой статье вы узнаете о том, как мы улучшали предыдущее решение и в итоге пришли к идее отдельного инструмента.

Читать...

Data Science | Machinelearning [ru]

20 Sep, 12:37


😎Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models

Takin TTS, языковую модель нейронного кодека, которая основана на усовершенствованном нейронном речевом кодеке и многозадачной обучающей структуре, способной генерировать высококачественную естественную речь с нуля.

Систему Takin Morphing с высокоразвязанными и продвинутыми подходами моделирования тембра и просодии, которая позволяет людям настраивать производство речи с их предпочтительным тембром и просодией точным и контролируемым образом.

Обширные эксперименты подтверждают эффективность и надежность наших моделей серии Takin AudioLLM.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться

Data Science | Machinelearning [ru]

20 Sep, 07:07


Всероссийский хакатон по Биометрии

Ежегодное командное соревнование в сфере технологий идентификации личности!

🚀Выберите один из предложенных кейсов:
🔹Разработка ассистента для упрощения регистрации в Единой биометрической системе (кейс ЦБТ);
🔹Создание инструмента для генерации синтетического датасета изображений ладоней (кейс Сбера);
🔹Создание инструмента для восстановления изображения из вектора биометрических персональных данных (кейс Мир Plat.form и СБП).

Отборочный этап пройдет в онлайн-формате. Финал пройдет на площадке в Москве, где команды смогут лично пообщаться с профессионалами в сфере биометрических технологий. Для финалистов из других регионов предусмотрено участие онлайн.

Дедлайн регистрации: 1 октября, 23:59
🦾Отборочный этап: 4-13 октября
📆Финал: 26 октября
👨‍💻Для кого: Разработчики, ML-специалисты, Data Scientists, UX/UI-специалисты

Подробности и регистрация: https://tglink.io/6006948c89ba

Data Science | Machinelearning [ru]

19 Sep, 17:07


ИТМО определил самые популярные Open Source решения в сфере ML/Data в России

Свежее исследование от ИТМО определило лидеров среди компаний, активно развивающих open-source проекты в области машинного обучения. Первое место занял Яндекс c 120 решениями и 65000+ звёзд на GitHub (мощный отрыв от остальных участников). На втором месте — Сбер, а замыкает тройку Т-банк. Критериями оценки были популярность и востребованность проектов в РФ и остальном мире.

Исследователи отмечают, что лидерство компании стало возможным, благодаря множеству успешных open source проектов в сфере Data/ML, активному участию в поддержке сообщества через мероприятия и гранты, а также высокому качеству репозиториев и активным контрибьюторам.

Эксперты также поделились общими выводами по сфере:
— Вклад в открытый код становится важнее конкуренции
— Open source объединяет специалистов со всего мира
— GitHub остаётся стандартом, но растёт интерес к альтернативам
— Компаний ориентируются не только на внутренний, но и на международный рынок


Статью об исследовании можно почитать на хабре.

Data Science | Machinelearning [ru]

19 Sep, 12:48


👨‍💻Промпт-инжиниринг: как найти общий язык с ИИ

В этой статье я расскажу почему эта профессия приобретает всё большую значимость и как можно использовать приёмы промпт-инжиниринга в работе и повседневной жизни.

Читать...

Data Science | Machinelearning [ru]

18 Sep, 17:07


​​🖥 Самые интересные статьи за последние дни:

• Как искусственный интеллект может преобразить здравоохранение

• Эмуляция мозга: 6 ключевых вопросов на пути к AGI

• Безопасность приложений больших языковых моделей (LLM, GenAI)

Data Science | Machinelearning [ru]

18 Sep, 12:07


​​🧠Эмуляция мозга: 6 ключевых вопросов на пути к AGI

В этой статье вы узнаете о текущих подходах и вызовах, связанных с созданием искусственного общего интеллекта (AGI) через эмуляцию мозга.

Читать...

Data Science | Machinelearning [ru]

18 Sep, 08:37


Вот что ждет в Т-Банке ML-разработчиков, кроме ДМС, крутых офисов и других плюшек:

Актуальный стек. Здесь следят за трендами и быстро внедряют новое.
Общение на «ты». Так проще.
Прозрачная система роста. Вы всегда будете знать, какие навыки нужно подтянуть и как получить повышение.
Вы окажетесь среди профессионалов, у которых можно многому научиться. А если захотите — можете стать ментором для младших коллег.

Больше о вакансиях ML-разработчиков — здесь

Erid:2Vtzqx7sz64

Data Science | Machinelearning [ru]

17 Sep, 17:07


​​🔒Безопасность приложений больших языковых моделей (LLM, GenAI)

В этой статье вы узнаете о ключевых уязвимостях, связанных с безопасностью приложений, использующих большие языковые модели (LLM) и генеративный искусственный интеллект (GenAI), а также о рекомендациях по их предотвращению.

Читать...

Data Science | Machinelearning [ru]

17 Sep, 14:07


Освойте аналитику данных, обучаясь на кейсах из реального бизнеса *️⃣

Вы будете не просто изучать аналитику — вы будете решать рабочие задачи, что равноценно прохождению стажировки начинающим аналитиком.

👆Подбираем персональный трек обучения под ваши задачи — устроиться в крупную IT-компанию или релоцироваться. А также помогаем с прохождением собеседований.
👆87% учеников за 2 месяца находят работу. Наши выпускники работают в Тинькофф, Авито, Яндекс, Skyeng, Магнит, Сбер, Ozon, Альфабанк и др. компаниях.

По итогам курса вы сформируете собственное портфолио. Такого не будет ни у кого больше. Уникальное оформление, максимально прикладные задачи из разных сфер бизнеса. Их невозможно сгуглить или найти разбор на Хабре.

Обучайтесь в комфортном темпе: доступ к материалам останется у вас навсегда.

Вы еще успеваете начать обучение с текущим потоком🔥
Оставляйте заявку на сайте и получите 10% скидку по промокоду DEV

Data Science | Machinelearning [ru]

17 Sep, 12:07


​​⚡️Симуляция DOOM через нейросеть

В этой статье автор расскажет о проекте, который использует нейросети для создания симуляции игрового процесса в классической игре DOOM.

Читать...

Data Science | Machinelearning [ru]

17 Sep, 07:37


Как искусственный интеллект меняет правила игры в бизнесе?

Приглашаем тебя на митап по Data Science от экспертов Газпромбанк.Тех, где ты узнаешь:

– Как мы используем нейронные сети для разбора платежных документов
– Каким образом оптимизатор позволяет максимизировать прибыль от маркетинговых коммуникаций
– Какие задачи решают квантовые технологии в мире финансов

В конце тебя ждет нетворкинг с участниками и спикерами митапа.

Регистрируйся и приходи 19 сентября к нам в гости: Москва, ул. Коровий Вал д.5, БЦ «Оазис» — https://vk.cc/cASz7c

Реклама, Банк ГПБ (АО), ИНН: 7744001497, erid: 2Vtzqw23Tc4

Data Science | Machinelearning [ru]

16 Sep, 17:07


​​🎮Генеративные модели в разработке видеоигр: будущее за играми от роботов?

В этой статье автор расскажет об изменениях, которые могут произойти в индустрии видеоигр с внедрением искусственного интеллекта, подчеркивая как потенциал, так и ограничения технологий.

Читать...

Data Science | Machinelearning [ru]

16 Sep, 12:07


​​🧠Как искусственный интеллект может преобразить здравоохранение

В этой статье вы узнаете о потенциальном влиянии искусственного интеллекта (ИИ) на сферу здравоохранения, а также о том, как ИИ может трансформировать подход к профилактике и лечению хронических заболеваний.

Читать...

Data Science | Machinelearning [ru]

15 Sep, 17:07


​​🖥 Самые интересные статьи за последние дни:

• Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах

• Как мы строили сквозную аналитику и укрощали бизнес-требования

• OpenAI о новых моделях ИИ, которые умеют рассуждать

• LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM

Data Science | Machinelearning [ru]

15 Sep, 13:07


Чемпионат по программированию от МТС

Прими участие в True Tech Champ с призовым фондом 10 250 000 ₽. В чемпионате есть задачи как для начинающих ИТ-специалистов, так и для опытных разработчиков.

✔️В алгоритмическом треке участники будут работать со структурами данных, покажут математические навыки и умение решать алгоритмические задачи.
✔️В треке по программированию роботов нужно будет соревноваться на скорость прохождения лабиринта робомышью.

Регистрация: до 12 октября
Доступ к онлайн-заданиям: с 1 октября
Финал в офлайне: 8 ноября

Детали и регистрация по ссылке.

Data Science | Machinelearning [ru]

15 Sep, 12:07


​​👨‍💻LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM

В этой статье автор расскажет о оптимизации исходного кода для использования с большими языковыми моделями, что может быть полезно для программистов и разработчиков, использующих LLM.

Читать...

Data Science | Machinelearning [ru]

14 Sep, 17:07


​​🤖OpenAI о новых моделях ИИ, которые умеют рассуждать

В этой статье автор вы узнаете об ограничениях бета-версии, о том, как работает новая модель OpenAI, особенностях промптинга и других тонкостях.

Читать...

Data Science | Machinelearning [ru]

14 Sep, 12:07


​​🧐Мониторинг токсичного контента в AI продуктах

В этой статье рассматривается процесс сбора данных, применение моделей машинного обучения (таких как distilbert и toxic bert) и метрики для оценки их эффективности.

Читать...

Data Science | Machinelearning [ru]

13 Sep, 17:07


​​👥Как мы строили сквозную аналитику и укрощали бизнес-требования

В этой статье расскажу, как и почему мы решили внедрить сквозную аналитику в компанию, с какими сложностями столкнулись и как побеждали бизнес-требования.

Читать...

Data Science | Machinelearning [ru]

13 Sep, 14:07


Как получить офер в AI VK и Дзен для ML- и Backend-разработчиков

С 16 по 20 сентября пройдёт Late Night Offer для ML- и Backend-разработчиков, где за два-три вечера вы можете получить офер от VK. Общайтесь с рекрутерами, выбирайте команды, проходите техсобеседования с тимлидами и финальные интервью. После успешного прохождения всех этапов вы можете получить офер в тот же день. Отклики принимаются до 15 сентября включительно.

Откликнуться

Data Science | Machinelearning [ru]

13 Sep, 12:07


​​😎Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах

В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных и способы повысить точность маленькой архитектуры.

Читать...

Data Science | Machinelearning [ru]

13 Sep, 07:07


🎉МТС Web Services запустили подкаст PRO Данные — о больших данных в облаках!

🌟В первом выпуске гости обсудили облачные хранилища, их возможности и зачем они нужны бизнесу.

Участники:
🌟Крестина Андреева, руководитель центра Data MTС Web Services

🌟Антон Близгарев, директор по развитию облачных продуктов Arenadata

🌟Максим Ситников, ведущий выпуска

📊 Количество данных растёт экспоненциально: расширять физические системы становится очень дорого, локальное хранение перестаёт быть рентабельным. Размещение в облаке серьёзно удешевляет хранение и переносит затраты из капитальных в операционные. А ещё позволяет добиться нужной производительности и модернизировать хранилища on-prem, которые «так исторически сложились».

🎙 Другие плюсы хранения данных в облаке, тенденции развития индустрии и интересные инсайты — в подкасте!

Смотрите и слушайте где удобно.
🎼VK видео
🎼Mave
🎼Строки
🎼Яндекс.Музыка
🎼Apple Podcasts

Реклама. Информация о рекламодателе.

Data Science | Machinelearning [ru]

12 Sep, 17:07


​​👤Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.

Читать...

Data Science | Machinelearning [ru]

11 Sep, 17:11


​​​​🖥 Самые интересные статьи за последние дни:

• Как давать нейросети задания, чтобы она вас понимала

• ML-подход к заблаговременному предотвращению оттока рекламодателей

• Как найти иголку в стоге сена? Или обзор Retrieval Algorithms

Data Science | Machinelearning [ru]

11 Sep, 12:08


​​⚡️ML-подход к заблаговременному предотвращению оттока рекламодателей

В этой статье мы опишем систему для заблаговременного предотвращения оттока рекламодателей, основанную на машинном обучении (ML, Machine Learning).

Читать...

Data Science | Machinelearning [ru]

11 Sep, 07:08


МТС Web Services представила новое направление на форуме Kazan Digital Week — ИИ-облако.

Оно поможет компаниям ускорить внедрение искусственного интеллекта без инвестиций в собственное оборудование. В его основе находится инфраструктура с графическими ускорителями для обучения и работы с ИИ.

На основе GPU компании смогут самостоятельно развернуть необходимое для работы с ИИ программное обеспечение, либо использовать «из коробки» уже готовые решения, доступные в ИИ-облаке. Например, ML-платформу – специализированное ПО, позволяющее автоматизировать процесс обучения моделей искусственного интеллекта, а также упрощающее их внедрение в бизнес-процессы компаний и последующую работу с ними.

Также в рамках ИИ-облака будут доступны готовые к работе «из коробки» сервисы MTS AI. Такие как Cotype – большая языковая модель, созданная для работы с корпоративными данными, Audiogram - платформа синтеза и распознавания речи на основе нейронных сетей с возможностью управления интонацией, ударениями и другими параметрами и сервис речевой аналитики WordPulse.