PyMagic @pymagic Channel on Telegram

PyMagic

@pymagic


Data Science / ML / Deep Learning
VK group https://vk.com/club211095898

PyMagic (English)

Welcome to PyMagic, your ultimate destination for all things Data Science, Machine Learning, and Deep Learning! If you are a data enthusiast, a budding machine learning engineer, or simply someone curious about the world of AI, this channel is perfect for you. With a focus on Python, the most widely used programming language in the field of data science, PyMagic provides valuable insights, tips, tutorials, and resources to help you stay up-to-date with the latest trends and developments in the industry. Join our community of like-minded individuals who are passionate about harnessing the power of data to drive innovation and change. Whether you are a beginner looking to kickstart your journey in the world of data science or an experienced professional seeking to expand your knowledge, PyMagic has something for everyone. Be sure to also check out our VK group at https://vk.com/club211095898 for additional content and discussions. Don't miss out on the magic of PyMagic - join us today and unlock the secrets of Data Science, ML, and Deep Learning!

PyMagic

17 Nov, 12:56


👀 Как я притворилась начинающим Data Scientist без опыта и пошла искать работу

Хейтеры скажут, что сгенерировала нейросеть) Не будем их переубеждать, пусть спят спокойно 🤣

Мне стало интересно, как сейчас обстоят дела на рынке вакансий для начинающих. Я проходила это давно, но решила проверить на себе.

Сразу прошу прощения у коллег по цеху за потраченное время ❤️ Я верю, что этот ролик поддержит умных и старательных ребят, которые сомневаются в себе. Хочется вселить в них надежду и поддержать, чтобы они дошли до конца, тем самым повысить качество кандидатов при найме в компании, где мы работаем.

➡️Немного поделюсь своим опытом. Я вам открою секрет: для каждой сферы своей жизни — работы, здоровья, семьи — я прикладываю огромные усилия. Мне ВСЁ достается С ОГРОМНЫМ ТРУДОМ! Иногда хочется, чтобы хоть в чем-то улыбнулась удача, но нет — чуда не происходит. Многие из вас и представить себе не могут как это обидно! ВСЕ, что у меня сейчас есть, — результат УПОРНОГО и ДОЛГОГО труда!

➡️Ждать, что на первых шагах в профессию после 5 откликов на hh, вы пройдете 4 собеседования, и вам предложат после них 3 оффера, — наивно. Особенно если вы не можете нормально сделать пет-проект, а ведь как еще без опыта работодатель поймет на что вы способны. А таких, у кого с этим проблемы, судя по резюме кандидатов, которые мы с коллегами постоянно отсматриваем, более 90%.

🌿 Вы должны понять, что в первую очередь решают знания, знания — это сила. Если не получается долгое время, скорее всего допущены ошибки. Иногда вы все делаете правильно, но нужно подождать, перетерпеть. А иногда стоит признаться самому себе, что эта сфера и работа вам на самом деле не нужны.

https://youtu.be/WEMBiBUEZOM?si=BTDXx5VuJtUF7j8S

PyMagic

06 Nov, 10:31


🔥Черная пятница. Распродажа курсов🔥

Друзья, приготовили для вас скидки на курсы PyMagic!

1️⃣Курс Natural Language Processing

➡️Скидка на сайте 40% по промокоду BLACKFRIDAY до 11 ноября
➡️Что узнаете:
- Что такое NLP? Как делать предобработку текста (токенизация, стемминг и т.д.)
- Напишите свой чат бот на регулярках и запустите его в телеграмм
- Разберете лексический анализ. WordNet, TF-IDF, LSA
- Напишите и обучите нейросеть для перевода с одного языка на другой
- Разберете огромнейшую тему Transformers в теории и на практике: BERT, ChatGPT, T5 и т.д.
- Не обойдете стороной и практику с Hugging Face
- Разберете примеры из реальной работы на Python с обучением моделей, а также как грамотно деплоить такие модели в прод

2️⃣Курс MLOps. Промышленный ML

➡️Скидка на образовательной платформе 30% по промокоду BLACKFRIDAY до 11 ноября
➡️Что узнаете:
- Паттерны ML-инференса
- Как перейти от Jupyter Notebook к промышленному коду
- Тесты для ML-моделей
- Воспроизводимость моделей и развертывание сервиса при помощи FAST API
- Airflow для обучения ML-модели при помощи пайплайна задач
- Docker Compose
- Мониторинг при помощи Grafana
- CI в GitHub Actions

3️⃣Курс Advanced MLOps. Промышленный ML

➡️Скидка на образовательной платформе 30% по промокоду BLACKFRIDAY до 11 ноября
➡️Что узнаете:
- Инфраструктура как код
- Работа с Terraform
- Основы Kubernetes для DS
- Кластер Kubernetes для REST- сервиса
- Apache Kafka
- Confluent Cloud
- CI/CD в GitHub Actions
- ArgoCD

Более подробная информация на сайте PyMagic
Мы также принимаем платежи из за рубежа 🌎

PyMagic

02 Nov, 13:02


💡Идея для крутого pet-project

➡️Вы часто пишите, спрашиваете у меня, что стоит сделать в качестве пет проекта. Ловите классную идею - имплементация мл алгоритмов из научной статьи

❗️Это крутая возможность не только сделать заметный проект, но и прокачаться в более глубоком понимании алгоритмов, что очень важно в работе DS!

Единственный момент, мне не очень нравится, когда начинают писать, вот раньше трава была зеленее, а нас сейчас заставляют чуть ли не степень доктора наук получать, чтоб работать стажером… Давайте не будем преувеличивать.

➡️Я предлагаю посмотреть на подобного рода проекты с интересом: это же так круто разобраться в шестеренках сложного алгоритма, а потом получить реальный кайф от того, что у тебя получилось его реализовать!

Без минимального интереса в какой либо профессии очень сложно. Либо она для вас временная для заработка денег, либо вообще не ваша.

https://youtu.be/yvbEd1YWQ7Q?si=i-1BI_gzG-r8ifm8

PyMagic

30 Oct, 11:40


❗️Друзья, у нас сразу две классные новости!

1️⃣Во-первых, мы открыли предзапись на 8-й поток нашего курса по Data Science для начинающих.

В этом году все места на тарифе Grandmaster были раскуплены, ведь именно там дополнительно к основной части мы подробно рассматриваем направления NLP и RecSys:
Обработка текста, регулярные выражения, tf-idf, Spell Checker, Word2Vec
RNN для NLP, BiLSTM, ELMo, Transformer, BERT, GPT, Transfer Learning, внедрение NLP-моделей в продакшен
Коллаборативная фильтрация (user/item-based), content-based подходы, гибридные модели, валидация RecSys моделей, ранжирование
Sequantial models (next item/basket, BERT4REC, SASREC), графовые модели, автоэнкодеры

➡️Записаться и посмотреть программу можно здесь

2️⃣Во-вторых, к нам часто обращаются с вопросом: «У меня уже есть база по Python, математике и статистике, я знаком с основными темами. Вы продаете отдельные блоки из вашего курса?»

Теперь ответ – почти да! Мы разработали отдельный курс по Data Science для аналитиков данных. Чтобы проверить, достаточно ли у вас знаний для прохождения этой программы, можно пройти тест на базовые знания

➡️Ну а если вы уверены в своих силах, то записаться и посмотреть программу можно здесь

PyMagic

28 Oct, 11:20


💬Тематическое моделирование в NLP

Тематическое моделирование позволяет автоматически обнаруживать и извлекать скрытые темы в текстах. В основе его работы лежат алгоритмы, которые анализируют слова и их связи, выявляя общие темы и паттерны.

➡️ Зачем нужно тематическое моделирование?

Тематическое моделирование позволяет быстро анализировать большие объемы текста, выявляя ключевые темы без ручной классификации. Это особенно полезно для мониторинга трендов, так как помогает отслеживать изменения в общественном мнении и определять новые популярные темы в социальных сетях, новостях.

➡️ Подходы в тематическом моделировании

LDA (Latent Dirichlet Allocation) — один из самых популярных алгоритмов для тематического моделирования. Он моделирует темы как распределения слов, основываясь на статистических паттернах в текстах. LDA позволяет определить, какие слова наиболее вероятно связаны с каждой темой, что делает его мощным инструментом для анализа текстов

NMF (Non-Negative Matrix Factorization) — метод, который раскладывает матрицу документов с текстом на две неотрицательные матрицы. Одна матрица представляет темы, а другая — их связь со словами

Word Embeddings — использование векторных представлений слов, таких как Word2Vec, GloVe, BERT и пр. Эти модели позволяют не только выявлять семантические отношения между словами, но и выполнять более глубокий анализ текстов, учитывая контекст. BERT, в частности, обеспечивает превосходные результаты в понимании сложных текстов благодаря своей способности учитывать предшествующий контекст слов. После получения эмбеддингов используют кластеризацию для разбиения документов на темы.

❗️Помимо прочего можно не останавливаться только на выбранной модели, на подборе ее гиперпараметров, а попробовать подход ансамблирования, который на практике дает результаты лучше. Например, Ensemble Latent Dirichlet Allocation (eLDA) обучает ансамбль моделей, отбрасывая не повторяются темы.

PyMagic

16 Oct, 14:26


#wb_в_деле
Привет! 11 сентября прошел первый ML Meetup Wildberries. Делимся видеозаписями докладов ⬇️

⚪️«Применение ML в продуктах и внутренних процессах Wildberries», Александр Сидоров, Head of DS Wildberries
YouTube
VK

⚪️«Графовые нейронные сети в рекомендациях», Александр Тришин, Data Scientist RecSys
YouTube
VK

⚪️«Мультиязычный текстовый энкодер в похожих товарах», Георгий Соколов, Data Scientist RecSys
YouTube
VK

⚪️«Жаргон и именованные сущности в спеллчеке в Поиске», Анна Текучева, Data Scientist HML
YouTube
VK

Больше новостей о DS&ML Wildberries в канале WB Space — подписывайтесь!

PyMagic

16 Oct, 14:26


Друзья, наконец подъехали видео с нашего ML митапа в wb! Там же вы сможете посмотреть и фоточки с мероприятия 🤗

Очень горжусь тем, что несмотря ни на что, мы сделали это классно!

PyMagic

15 Oct, 11:10


🚀DIFF Transformer -> Новый шаг в развитии языковых моделей

Исследователи из Microsoft Research и Университета Цинхуа представили новую архитектуру — DIFF Transformer (да, опять что то новенькое!). Этот подход решает проблему "шума" в механизме внимания, что позволяет языковым моделям более эффективно фокусироваться на важных частях текста и игнорировать нерелевантную информацию.

🔍 Как это работает?
DIFF Transformer использует дифференциальный механизм внимания, который разделяет вектора запросов и ключей на два attention maps и вычисляет два отдельных "softmax". Разница (разность в формуле) между этими attention maps позволяет устранить общий шум и сосредоточиться на ключевой информации. Этот метод вдохновлён принципами из электротехники, где шум устраняют через дифференциальные усилители.

➡️ Что это даёт?
- Повышенная точность за счёт уменьшения "шума" внимания
- Улучшение стабильности и эффективности обучения благодаря использованию методов, таких как pre-RMSNorm и SwiGLU (заимствованы из LLaMA)

📄 Читать статью
💻 Код на GitHub

PyMagic

10 Oct, 14:30


НЕ СТОИТ РАБОТАТЬ В ТАКОЙ КОМПАНИИ ⚠️

Какие существуют тревожные сигналы, указывающие на то, что в данной компании не стоит работать и даже не следует тратить время на собеседование?

Спойлер:
Я бы не была столь категоричной в отношении всей компании. Часто проблема касается лишь отдельных отделов или департаментов. Посмотрев на соседнюю команду в той же компании, вы можете удивиться, насколько сильно всё может отличаться 😉

https://youtu.be/F5k2rIwDw4Q?si=0unaq8qbba29TbfG

PyMagic

09 Oct, 11:01


Есть ли светлое будущее у AI? 🤔

Недавно посмотрела новое видео Евгения Разинкова, где он делится своим взглядом на последние изменения в LLM, да и в целом на AI. Мне понравилось, что он предлагает взглянуть на происходящее с оптимизмом. Да-да, апокалипсис пока что откладывается! 😉

Ключевая мысль — большие языковые модели действительно меняют рынок, но это открывает перед нами новые горизонты. Пусть кажется, что все простые задачи уже решены, на самом деле впереди нас ждут более сложные и интересные вызовы, которые потребуют глубоких знаний и экспертизы.

❗️Мне понравилась его аналогия: LLM — это как электричество. Нам больше не нужно самим обучать модели с нуля, так же как и не нужно заботиться о том, как вырабатывается электричество: когда вы вставляете чайник в розетку, вы ведь не переживайте, что ой, электричество вырабатывается не вами - плюсую!!

➡️Мы просто подключаемся к готовым решениям — будь то GPT, LLaMA или любые другие модели — и начинаем использовать их для своих проектов и задач.

Подробнее в новом ролике на ютуб канале Евгений

PyMagic

21 Sep, 11:01


Последние 4 места 🔥

Друзья, 23 сентября уже стартует курс по машинному обучению! Осталось очень мало мест.

➡️Тариф базовый Expert - 1 место
➡️Тариф расширенный Gramdmaster - 3 места

Во Gramdmaster ПОДРОБНО разбираем NLP и RecSys, до такой степени, что этих знаний хватит, чтобы дорасти до Senior.

❗️Важно: это авторский курс, а не массовое производство студентов с одинаковыми резюме. Программа отточена годами. Почти все наши студенты и выпускники отмечают, что на собеседованиях их уровень оценивают как Middle по ML (один из студентов, скрином выше, дополнительно к нему писал мне об этом лично).

Мы обязательно проходим:
всю необходимую математику для DS
изучаем Python
ML алгоритмы (а также from scratch)
когда и как грамотно применять ML алгоритмы
MLOps и с деплоем собственной модели

А если вы выбрали тариф Grandmaster, то получите углубленные знания по NLP, начиная с классических подходов и до современных трансформеров, а также знания по RecSys, включая SOTA решения — и всё это с оттачиванием на практике.

Подробнее о курсе

PyMagic

20 Sep, 12:36


🏆 Российский AutoML побеждает на международной арене

Команда “LightAutoML testers” победила в международном соревновании Kaggle AutoML Grand Prix! Наши ребята: Александр Рыжков, Дмитрий Симаков, Ринчин Дамдинов и Иван Глебов с помощью решений на основе LightAutoML обошли известных конкурентов по индустрии, включая команды из Amazon и H2O!

🚀 LightAutoML - бесплатный и открытый инструмент
Ключом к успеху стала open-source библиотека LightAutoML (LAMA), которая автоматизирует построение моделей машинного обучения. Благодаря использованию библиотеки ускоряется построение моделей и, зачастую, повышается качество. Инструмент подойдет как новичкам, так и профессионалам - решение можно получить как в несколько строк, так и с полной кастомизацией.

🌍 Kaggle AutoML Grand Prix 2024
Это - онлайн соревнование, приуроченное к ежегодной международной конференции International Conference on Automated Machine Learning, которая в этом году пройдет в Париже. Соревнование проходило на Kaggle (самой масштабной мировой платформе для соревнований по анализу данных) в 5 этапов, в каждом из которых было необходимо создать качественную модель машинного обучения всего за 24 часа.

🎓 Делимся опытом
Хотите узнать секреты победителей? Запись вебинара, где команда подробно рассказала о своих решениях, уже опубликована в канале @lightautoml!

PyMagic

19 Sep, 11:12


Vision-Language Models (VLM)

Визуально-языковые модели (Vision-Language Models, VLM) стали одной из самых актуальных тем в машинном обучении за последний год 🔥

Что такое VLM?

VLM — это модели, способные одновременно анализировать и понимать как текст, так и изображения. Обучаясь на огромных наборах данных, где каждое изображение сопровождается текстовым описанием, они учатся связывать визуальные и текстовые концепции. Это позволяет им решать задачи, которые раньше требовали отдельных моделей для обработки текста и изображений.


Стратегии обучения

➡️ Контрастивное обучени. Модель обучается выравнивать изображения и тексты в общем пространстве признаков, отличая похожие пары от непохожих 🐱🐶

➡️ PrefixLM. Обучение векторных представлений изображений и текста с использованием изображений в качестве префикса для языковой модели

➡️ Мультимодальное слияние (fusing) с кросс-вниманием. Интеграция визуальной информации в слои языковой модели с помощью механизма кросс-внимания

➡️ Masked Language Modeling (MLM) / Image-Text Matching (ITM). Выравнивание частей изображений с текстом с использованием методов предсказания пропущенных слов и сопоставления изображений с текстом (маскирование моделирование 🎭)

➡️ Без обучения. Использование автономных моделей для обработки изображений и текста через итеративную оптимизацию


Примеры моделей

CLIP (Contrastive Language-Image Pre-training). Модель, использующая контрастивное обучение для вычисления сходства между текстовыми и визуальными объектами через отдельные энкодеры.
LLaVA (Large Language and Vision Assistant). Мультимодальная модель, способная генерировать текст и отвечать на вопросы по изображениям.

PyMagic

16 Sep, 15:38


💎 Какие темы важны при изучении Python в 2024 году?

https://youtu.be/txefpCeZItQ?si=8zBne6NoFtj6fH2F

Python на текущий момент является одним из популярных языков программирования во всем мире по версии индекса TIOBE. А на конец года запланировано больше обновление, об этом писала в этой статье!

➡️Какие темы важны при изучении данного языка? Какие библиотеки необходимо знать, если вы хотите дальше использовать Python для анализа данных и машинного обучения?

Обо всем об этом очень подробно в новом ролике. Подробный план прилагается ⬇️

PyMagic

14 Sep, 11:36


🔍 Оптимизация поиска гиперпараметров: метод последовательного деления пополам

Очень много информации по GridSearch, RandomSearch и даже по другим видам поиска Optuna / HyperOpt, но вот про метод последовательного деления пополам почти ничего не встречала в массовом сегменте. Кстати, он реализован в scikit-learn и представлен в виде HalvingGridSearchCV и HalvingRandomSearchCV, разберем работу последнего.

➡️ Как работает HalvingRandomSearchCV?
1. Генерируется большой набор случайных конфигураций гиперпараметров
2. Обучение моделей на ограниченном кол-ве ресурсов (например, модели обучаются на небольшом подмножестве данных)
3. Отбрасываются N% худших моделей (N - это параметр factor)
4. Процесс повторяется со 2 шага, но уже с увеличенным кол-вом ресурсов

Этот цикл продолжается, пока не останется одна лучшая конфигурация. В реализации HalvingGridSearchCV на 1 шаге вместо случайных конфигураций, используются все.

➡️ Ключевые параметры:
- resource='n_samples' - использует размер обучающего набора как варьируемый ресурс
- factor - определяет процент отсеиваемых кандидатов (например, при factor=1.5 100 / 1.5 =~ 67% кандидатов пройдут в следующий раунд)
- n_candidates='exhaust' - автоматически выбирает количество конфигураций для максимального использования ресурсов в последнем раунде

🏃‍♀️Пример использования:
# включаем экспериментальную функцию
from sklearn.experimental import enable_halving_search_cv
from sklearn.model_selection import HalvingRandomSearchCV

hs = HalvingRandomSearchCV(
estimator,
param_distributions=param_grid,
n_candidates='exhaust',
resource='n_samples',
factor=1.5,
random_state=1,
n_jobs=-1
)

hs.fit(X_train, y_train)


В нашей программе по обучению Data Science подробно разбираются методы оптимизации как классических моделей, так и нейросетевых на реальных данных.

Старт 23 сентября, осталось 11 мест, из них 5 мест в брони. Более подробная информация и программа обучения на сайте PyMagic

PyMagic

13 Sep, 08:23


ИИ нас всех заменит? 🤖

Тестила сама данные кейсы, понятно, что пробелы везде и всегда можно найти, но на мой вкус, цвет и качество тот же Claude Sonet получше будет.

Хотя по бенчмаркам видим немного другую картинку)

А пока мои любимые сеньоры и сеньориты дата саентисты, можем расслабиться, восстание роботов откладывается еще на год 🤣

PyMagic

13 Sep, 08:23


Ну, это уже успех: 2 из 3 сложных задач 🍓

@xor_journal

PyMagic

10 Sep, 11:27


➡️ Data Science для начинающих

Уже 23 сентября у нас стартует 7-ой поток курса по Data Science.

📎Что вы изучите:
- Математику для Data Science
- Как проводить АБ-тестирование
- Классические ML-алгоритмы: от линейных моделей до бустингов
- Научитесь разбираться в ML-алгоритмах и грамотно их применять
- NLP: от TF-IDF до Transformers
- Deep Learning: основные тренды, база по нейросетям
- Computer Vision: примеры из области
- MLOps: production code, FastAPI, Streamlit, линтеры
- Дополнительно: Airflow, MLFlow, многопоточность, мультипроцессинг, временные ряды, Superset и пр.

❗️В новом потоке мы добавили еще 2 расширенных блока: NLP и рекомендательные системы. Темы в этих блоках позволят вам открыть для себя больше вакансий для начинающих, а также быстро вырасти до Middle позиции, так как материал в них разобран подробно и на высоком уровне!

❗️Осталось всего 14 мест.

https://pymagic.ru/data-science

PyMagic

06 Sep, 11:20


Приглашаем вас на независимую конференцию AiConf 2024, которая пройдет 26 и 27 сентября в Москве! Это крупнейшее офлайн-событие для data science, ML инженеров.

Это не просто конференция, а площадка для обмена опытом, общения и профессионального роста.

Среди тем конференции:
- Работа со звуком
- Компьютерное зрение и генерация изображений
- Обработка естественного языка
- Рекомендательные системы и поиск
- Умные механизмы
- Разработка агентов
- Дискуссии на тему "ML будущего"
- Оптимизация использования железа

На AiConf 2024 вас ждут:

— Более 700 участников.
— Интерактивные стенды, где можно пообщаться со специалистами и узнать о новейших продуктах.
— Только хардовые доклады от лидеров рынка ИТ, а также из реального сектора экономики.
— Рассказы о кейсах и технологиях, которые можно сразу применить в своих проектах. Всё свежее, из первых рук.
— Неформальное общение на afterparty, мерч, активности и угощения!

Узнать больше о программе и купить билеты можно на сайте

С промокодом: "pymagic" - скидка 7% на все категории билетов.

До встречи на AiConf 2024!

PyMagic

03 Sep, 15:01


Мой рабочий день 3 сентября 🗓️🍁

Один из популярнейших вопросов еще во времена использования запрещеннограмма был: "Какие таблетки я принимаю, чтобы оставаться продуктивной?" 🤪

Давайте познакомимся. Я работаю в Wildberries руководителем центра компетенций по ML. У меня своя школа, где мы обучаем Data Science, NLP, MLOps и другим темам, связанным с данными. Также веду YouTube канал и другие соцсети. Помимо работы, я счастливая жена, у которой есть и обязанности по дому 😉

После этого ролика вы узнаете, как проходит мой рабочий день сейчас и как он проходил раньше, когда я работала Data Scientist. Вы сможете почерпнуть лайфхаки, как все успевать (хотя это скорее антиутопия), и что для этого нужно делать.

Для этого не обязательно закидываться препаратами, а нужно постараться выстроить грамотно свой график👌

https://youtu.be/L2ecNNIb03U?si=er0ffsk_7irduNxU

PyMagic

29 Aug, 17:58


PyMagic pinned «✉️ Старт 7го потока курса по Data Science для начинающих Друзья, напоминаю, что уже менее чем через 3 недели стартует наш новый поток. На этот раз мы добавили расширенный тариф Grandmaster 🤴 Чему вы научитесь: Программировать на Python и писать сложные…»

PyMagic

29 Aug, 17:58


✉️ Старт 7го потока курса по Data Science для начинающих

Друзья, напоминаю, что уже менее чем через 3 недели стартует наш новый поток. На этот раз мы добавили расширенный тариф Grandmaster 🤴

Чему вы научитесь:
Программировать на Python и писать сложные запросы на SQL
Освоите необходимую математику для Data Science
Научитесь проводить А/Б тестирование, будете понимать, когда какой критерий применять
Изучите методы машинного обучения и тюнинг моделей
Научитесь писать production-код и создавать сервисы (MLOps)
Погрузитесь в Deep Learning и освоите основы работы с нейросетями
Узнаете, как побеждать в соревнованиях на Kaggle

В новом тарифе представлена расширенная программа по NLP, включающая:
Предобработка текста: токенизация, стемминг, лемматизация, TF-IDF, регулярные выражения
Языковое моделирование: Word2vec, LSTM, механизмы внимания, BERT, GPT

Также добавлена расширенная программа по рекомендательным системам, включающая:
Классические модели: коллаборативная фильтрация, контентные и гибридные системы
Оценка и валидация рекомендаций
Последовательные рекомендации, автоэнкодеры, графовые модели

Дополнительно доступны материалы:
Временные ряды
Асинхронность, многопоточность и мультипроцессинг
Парсинг данных
MLFlow, Airflow, Tableau, Git, Superset
Примеры реальных проектов в Computer Vision

Ух как много всего! Более подробная программа, цены с типами оплаты

➡️ Старт 7-го потока 23 сентября! Записаться и узнать больше можно на сайте PyMagic

PyMagic

27 Aug, 14:41


ML-митап 🎉

Друзья, приглашаю вас 11 сентября на наш первый оффлайн ML-митап Wildberries! Мы поделимся опытом применения машинного обучения в наших продуктах и процессах.

🛒 Wildberries - это миллионы пользователей, товаров и миллиарды запросов ежедневно. Мы расскажем, как устроены рекомендации и поиск изнутри.

На митапе выступят:
➡️Саша Сидоров, Head of Data Science. Поделится тем, как применяется DS/ML в бизнесе Wildberries, расскажет про используемые модели, технологии и инфраструктуру

➡️Александр Тришин, Data Scientist в команде персональных рекомендаций. Расскажет про сверточные графовые сети и архитектуру LightGCN

➡️Георгий Соколов, Data Scientist в команде товарных рекомендаций. Поделится опытом обучения представлений для поиска похожих товаров

➡️Анна Текучева, Data Scientist в Горизонтальном ML (команда NLP\RecSys). Расскажет про выделение и исправление именованных сущностей для поиска

Ну и конечно же я там тоже буду! Можно будет лично со мной пообщаться, задать вопросы! Очень всех жду, приходите! 💗

Зарегистрироваться можно тут
Подробности в канале WB Space

PyMagic

25 Aug, 12:01


🔬Пошаговый план обучения ML

Пока кипишь с Павлом Дуровым чуть поутих, ждём новостей 👮‍♂️предлагаю посвятить время полезному образовательному контенту.

📌 Инвестиции в ваше развитие, образование - это прочный фундамент и основа вашего настоящего и будущего. Они позволяют вам не сильно переживать о том, что происходит в мире, а надеяться на себя и свои силы 👌

➡️Я не раз уже на канале выпускала видео с пошаговым планом обучения Data Science с нуля. Но мир меняется, требования меняются, что то остаётся неизменным (база), поэтому, решила обновить материал по данной теме 😉

➡️В видео рассмотрены не только темы по DS, но и затронуты важные моменты по поводу pet-проектов. Постаралась дать конкретные рекомендации по ним, которые используем и у себя в школе.

🦜 Конечно же куча полезных бесплатных материалов, где вы сможете изучить данную область самостоятельно, в этот перечень вошли полезные каналы, а также ресурсы от комьюнити ODS.

https://youtu.be/bo_w0c3dKeI?si=OwKjuj-nRrt3FJgB