мамкин Data Scientist @mommyscientist Channel on Telegram

мамкин Data Scientist

@mommyscientist


Ваш мамкин дата сайнтист @BoykoAA

мамкин Data Scientist (Russian)

Добро пожаловать в Telegram-канал 'мамкин Data Scientist'! Если вы ищете увлекательный контент о науке данных от человека, который знает толк в этом деле, то вы попали по адресу. Наш основатель - @BoykoAA, который сочетает в себе профессионализм и юмор, чтобы сделать изучение науки данных не только увлекательным, но и познавательным. Здесь вы найдете интересные статьи, обзоры последних тенденций в мире данных, а также советы и рекомендации от опытного специалиста. 'мамкин Data Scientist' - это не просто еще один канал о науке данных, это место, где вы сможете расширить свои знания и навыки, а также получить вдохновение для своих проектов. Присоединяйтесь к нам прямо сейчас и станьте частью нашей дружной научной команды! 📊🔬💡

мамкин Data Scientist

10 Sep, 09:00


​​Здорова, бандиты

Учебный движ уже начался, а ты еще не знаешь, что станешь квантом в этом году. Плохие вести всегда неожиданны – придётся признаться родителям

Набор в ЦМФ скоро заканчивается. Это единственный раз в году, когда можно послушать мой курс про HFT и пройти путь молодого кванта

В связи с этим предлагаю отложить задачу скроллинга ленты тиктоков до конца, завалить ebalo и заняться делом

Отбор происходит в 3 этапа:
1) CV
2) Тестовое задание
3) Устное собеседование

Тестовое достаточно злоебучее, придется потратить время и много гуглить.
Учиться будет тяжело: на лекциях много новой инфы, практические проекты требуют сил и времени. Короче, одни плюсы – все как мы любим, в режиме челленджа

Кроме теоретической базы и проекта, на котором надо по сути работать квантом, ЦМФ дает возможность вкатиться в квантовскую движуху и посмотреть на сферу изнутри

В общем, жду всех, кто не tupoy, на борту. Готовимся к квантовому скачку!

Рега → https://m.vk.com/wall-42556983_3138

Работаем, братва

мамкин Data Scientist

13 Sep, 08:00


​​Здорова, бродяги

Рассказываю историю. Однажды в маленьком южном городке, мы с Толей Карповым позавтракали игристой Балтикой 9 и решили записать контент. Состояние легкого шофЭ диктовало кайфовую атмосферу, и мы болтали о том о сем.

Главной темой традиционно стало “а можно ли в ДС с нуля” (можно). Если ты до сих пор та нежная pussy, которая не начинает учиться по причине внутренних размышлений, пора уже завалить ебыч, посмотреть видео и начать работать.

Давайте обозначим некоторый список тем:
- В дс с нуля как нехуй, но есть нюанс
- Работа в лабе и в хфт фонде, чем это похоже
- Как не быть лохом среди других кандидатов
- Чем занимаются кванты/трейдеры на работе
- Зачем нужен RAID

На следующий день после интервью удалось поменять банку рассола на промокод для курсов Толи, там за два года проделана титаническая работа, да и скидка нихуевая
Чит-код → MAMKINDS7P

Ну все, гасим свет, берем попкорн с дыркой в дне и смотрим. Поехали

Интервью → https://youtu.be/etewaQlTl-Y?si=W1d73E983H3_7uaF

Работаем, братва

мамкин Data Scientist

05 Sep, 09:00


Здорова, бандиты

Data Scientestы, как и большинство примитивных существ, должны объединяться в стаи для выживания.
Тогда хули мы тупим, го соберем рейд на Data Science и будем вымирать вместе. Разрешите представить вашему вниманию самое pizdatoe комьюнити для DS/ML/Quant движухи RAID on Data Science.

Пару слов про RAID.
1. Весь движ будет в Discord, поэтому просьба к зумерам, помогите пожилым людям установить этот мессенджер. Они до сих пор в ахуи, что пришлось мигрировать из icq.
2. Внутри можно найти полный набор для эффективной учебы: разделы с обучающими материалами, образовательные пайплайны для входа в DS, ответы на тупые вопросы, мемы, единомышленников.
3. Про карьеру тоже не забыл: начиная от подготовки к интервью, заканчивая вакансиями и карьерными советами. Кстати, сейчас там уже размещена вакансия на Junior Quantitative Researcher-а в топовую команду.
4. Ну и, конечно, различные топики для общения, начиная с базового Data Science, заканчивая тематическим каналом для ML соревнований и пристанища квантов.
5. Активности: вечерний покер, AMA/Q&A сессии с интересными гостями, открытые лекции

Главная фича – возможность собрать рейд буквально на любую активность будь то DS/ML соревнование, обучающий курс, подготовка к собеседованию или что угодно другое.
Для этого мы разработали специального бота. Приведу пример. Допустим существует книга, которую давно хочется прочитать, но не хватает мотивации или дисциплины на нормальный разбор каждой главы. Достаточно кинуть клич в тематическом чате и написать, что ты собираешь рейд на прочтение той или иной книги, затем написать в чате >create_raid book_name_raid, после чего любой желающий сможет присоединиться к группе по изучению этого материала использовав команду >join_raid book_name_raid. Все просто, один в один как в мморпг. Более подробно можно прочитать на главной страничке комьюнити.

Основная идея – собрать правильных людей вместе и получать удовольствие от процесса учебы, карьеры, общения. В комьюнити запрещено быть токсичным pidorom, будем уважать друг друга, пацаны.

Комьюнити полностью открытое, каждый может постить вакансии, общаться, учиться, объединяться, помогать нубам и делать это с кайфом. За все активности предусмотрены награды в виде особых ролей, цветных ников и фирменного мерча. Более подробно читай в welcome-and-rules.

Го рейд на Data Science? → https://discord.gg/xmrbsjm6cH

Работаем, братва

мамкин Data Scientist

08 Aug, 08:00


​​Здорова, флэш бойз

Продолжаем тему количественных финансов. Многие успели охуеть от вступительного задание в ЦМФ. Ну что вам сказать, легко не будет. Работа в финансах это конечно шлюхи и кокс, но есть нюанс, шлюха тут ты.
Сегодня речь пойдет не про что иное, как HFT (high-frequency trading).

В HFT логика остается, как и везде, купить дешево, продать дорого, просто делать это надо очень быстро. На самом деле, более 50% торгового объема на биржах это HFT роботы, обычно речь идет про миллионы операций в месяц.
Причем тут Data Science? Все просто, хоть временные промежутки и маленькие, данных приходится обрабатывать сотни гигабайт, искать нетривиальные зависимости и строить предсказания.

Хфт революция хорошо описана в книге Flash Boys, есть на русском и на английском
Книга → Flash Boys

Когда речь идет о HFT в разрезе работы с данными, нужно хорошо ориентироваться в микроструктуре рынка, предиктивных моделях, ордербуках и подобных терминах. Также эти знания необходимы для выполнения вступительного экзамена. Шерю чтиво на эту тему.

High frequency trading a practical guide to algorithmic strategies → Книга
Empirical Market Microstructure → Книга

Как понять насколько ты tupoy и оценить порог входа в индустрию. Однозначно все не так страшно как кажется, будет отдельный пост про подготовку к собеседованию на подобные позиции, но сейчас можно прикинуть пэнис к носу и посмотреть на книжку 150 Most Frequently Asked Questions on Quant Interviews. Полистай, попробуй порешать, но помни, лучший подход – систематический.

150 Questions → Книга

Теперь ботать! Дедлайн 25 числа, время поджимает. Надолго не прощаемся, готовлю бомбу в следующем посте

Работаем, братва

мамкин Data Scientist

07 Jul, 11:00


​​Здорова, ресерчеры

Готовимся поступать в Центр Математических Финансов (ЦМФ). Кванты, ебало к осмотру. Начинаем

Что такое ЦМФ
ЦМФ – центр обучения и подготовки кадров в области количественных финансов. По сути, ЦМФ представляет идеально место, чтобы вкатиться в квантовскую тусовку. Получить необходимые для работы навыки, поторговать ebalom перед компаниями, найти работу.

Что включает в себя программа:
1. Лекции и Семинары по базовым предметам, которые необходимы квантам: случайные процессы, теор. вер., эконометрика, МЛ и тд
2. Подготовка к собесам на регулярной основе. Брейнтизеры, задачи с собесов, выдрочка CV
3. Самое интересное. Можно выбрать направление, считай fuckультет, и неплохо углубиться в область. Я лидирую направление HFT (high-frequency trading), поэтому если выберешь что-то другое – BAN

Условия учебы:
Стоимость обучения: 0 рублей, 0 копеек (как раз все твои деньги, повезло, что под расчет).
Период обучения: Сентябрь - Декабрь (4 месяца).
Язык обучения: Английский. Тут стоит добавить, что не надо бояться, это будет первый год, когда программа проводится на английском языке, поэтому будут поблажки.
Сложность обучения: Будет сложно, нужно тратить много времени.

Как поступить
Поступление состоит из трех этапов:
1. Скоринг по CV
2. Тестовое задание
3. Устный экзамен по математике

Если с первым все понятно, то 2 и 3 пункт требуют дополнительного пояснения. Тестовое задание будет зависеть от fuckультета, который выбран. Какие материалы помогут выполнить тестовое задание по HFT и как подготовиться к устному экзамену расскажу в следующий раз.

А пока оставляем заявку на участие:
vk → https://vk.com/cmf_ynvrsty
linkedin → https://www.linkedin.com/company/cmf-ynvrsty

Тут можно посмотреть, что было в прошлом году на HFT направлении:
Market Making → https://www.youtube.com/watch?v=VwLe3tBl4fM&ab_channel=CMF
Market Prediction → https://www.youtube.com/watch?v=Wa4Xxxjl6YI&t=1s&ab_channel=CMF

Работаем, братва

мамкин Data Scientist

22 May, 09:00


​​Здорова, Перельманы

Сегодня обновленная, но все такая же пиздатая математика. Погнали

Математика – важный элемент науки о данных. Ботать придется много и упорно, но есть нюанс (анекдот знаешь).

Если раньше предлагалось действовать последовательно, вначале ботать матемку, а потом приступать к МЛ, то сейчас предложение другое. С двух ног влетаем в МЛ хоть с какой-то математикой на борту и разбираем непонятные вещи по ходу дела. Уперлись в проблему – погрузились в тему, иначе будем две жизни учиться.

Направлений в анализе данных много и математика для каждого из них нужна своя. Например, если по пьяни решишь быть квантом, то там крайне важна теория вероятностей, плавно перетекающая в случайные процессы. В других направлениях деградации несколько другая картина, поэтому учить что-то узкое нет смысла, будешь фитить это когда определишься с направлением. Сейчас имеет смысл освоить основы.

Теперь выдаю базу.

1. Курс DeepLearningAI так и называется Mathematics for Machine Learning and Data Science. Прекрасный материал, внутри линейная алгебра, матан, теор. вер. Смело берем и смотрим все подряд, наверное один из лучших вариантов. Тем более, сам бог велел наебать курсеру и взять его бесплатно, после трюка с удалением русскоязычных курсов. Пиши в личку, если не знаешь как.

Курс —> https://www.coursera.org/specializations/mathematics-for-machine-learning-and-data-science

Требование к прохождению курса. Базовый уровень школьной математики, вот тут можно освежить память. Первый пункт — цифры и блять буквы, если смог прочитать этот пост, можешь пропускать

Школьная программа —> https://mathter.pro/pesochnica/index.html

2. Мат. Анализ. По матану все достаточно просто, нам не надо убиваться десятью томами пыльных книг, нужен конечный набор тем, а именно:

1) Предел и непрерывность
2) Производная
3) Вторая производная и производные высших порядков
4) Гладкая оптимизация
5) Интегрирование

Ну и все бля, приключение на 20 минут, вошли и вышли. Найти темы можно вот в этом плейлисте:

Мат. Анализ —> https://www.youtube.com/@NEliseeva/playlists
Спидран по матану —> https://youtu.be/NX4s0ZE97Kc

Что касается практики, берем любой задачник по матану, но сильно не увлекаемся, научились считать 5 пунктов выше — едем дальше.

3. Теория Вероятностей. Несмотря на то, что вероятность быть pidorom у тебя равна единице, теор. вер. и мат. стат. заботать придется. Начинаем с основы:

Теор. Вер. База —> http://www.mathprofi.ru/teorija_verojatnostei.html
Мат. Стат. —> http://www.mathprofi.ru/matematicheskaya_statistika.html

4. Линейная алгебра. Линал круто помогает выработать интуицию процессов в анализе данных, предлагаю скипнуть решение задач на первом этапе, хорошо понятой теории будет достаточно. Смотрим тут:

Линал —> https://youtube.com/playlist?list=PLBh2i93oe2quLc5zaxD0WHzQTGrXMwAI6

Да, материала много, но ничего страшного внутри нет. Пацаны, в этом деле главное не ссать. Берем листочек, ручку и приступаем.
Сегодня не нравится, а завтра ты уже смотришь разбор задач с межнара по матемке, от любви до ненависти один шаг.

Напоминаю, что летом начинаем подготовку к поступлению в Центр Математических Финансов 2023, следующий пост про это. Давайте устроим лютый разъеб.

Работаем, братва

мамкин Data Scientist

27 Mar, 08:00


​​Здорова, профессура

Продолжаем модернизировать учебные пайпланы.
Курсера, aka кандидаты на премию Дарвина, заблочили курсы на русском языке, поэтому легендарная спецуха (олды на месте?) больше не доступна. Ушла эпоха.

Не страшно. Во-первых, спецуха уже чуть потаскалась, во-вторых, есть что предложить взамен.

За основу в оптимальном пайплайне берём курс вышки по МЛ. Программа покрывает все аспекты базового DS/ML. После курса можно смело решать соревнования, делать пет-проекты или идти ботать DL.
Что внутри? Динамичные 11 недель лекций, домашки и экзамен. Ведет курс Соколов. Тут остается добавить, что Женя на лютом опыте, стоял у истоков первых нормальных образовательных проектов по МЛ, некоторым может даже свести олдскулы. Порог входа низкий: не быть дибилом (ты не проходишь) и идти по пайплайну.

Курс —> https://openedu.ru/course/hse/INTRML/

Что касается простого пайплайна. Заменил курс по питону на тренажер. Поясняю за шмот, когда мамкин Data Scientist на старте нужно как можно больше писать код, писать, писать и еще раз писать. Лучше решить 100+ задач, чем послушать интересную теорию, поэтому не выебываемся и идем решать.

Тренажер —> https://pythontutor.ru/

Едем дальше. Стартовал CMF Graduate Program, туда можно было поступить только будучи выпускником основной программы. Проект, который я веду называется “HFT Market Prediction”, можно посмотреть презентацию тут.

Презентация проекта —> https://youtu.be/Wa4Xxxjl6YI?t=1

Через пару-тройку недель будем начинать готовиться к поступлению на основную программу Центра Математических Финансов. Экзамены летом, поэтому первому игроку приготовиться, буду ебать вас в хвост и в гриву. Ну и конечно расскажу, как эффективно подготовиться к экзамену.

В следующем посте обновим математическую часть пайплайнов.

Работаем, братва

мамкин Data Scientist

13 Feb, 08:00


​​Здорова, бандиты

Чуть не ебнулся пока просматривал новые курсы, вывод следущий: миллион посредственных, одинаковых материалов, которые пересказывают друг друга по кругу. Обещание элитных шлюх, стажировок и синьорной работы после трех недель учебы.
Если наша задача — последовательное восприятие правильной информаци, тогда необходимо быть осторожным, govna в голове у тебя достаточно.

Значит какой план. Удалось пересобрать пайплайны обучения в закрепе с поправкой на новые материалы и немного новой концепцией учебы. Заключается в том, что нужно как можно быстрей увидеть результат работы. Как можно быстрей начать решать практические задачи, учить модели, чистить данные и сверху на это обмазываться матемкой, иначе ботать можно бесконечно

Закреп —> https://t.me/mommyscientist/14

В нашем распоряжении три пайплайна обучения:
- Оптимальный
- Продвинутый
- Простой

Обзор на каждый курс внутри пайплайна либо уже на канале, либо выкачу в ближайшее время. Все курсы внутри почти бесплатные или вообще бесплатные, если у тебя финансовая ситуация как у латыша (huy да душа), то все ок

Далее в программе:
1. В начале марта стартует CMF Graduate Program, подробности на этой неделе
2. ТЗ, дизайн и БД обновленного сайта с вопросами для подготовки к интервью готова, скоро уходит в разработку
3. Обзор курсов из пайплайнов
4. Расширение блеклиста курсов. Скоро будем скидываться на реабилитацию после такой порции зеленого слоника

Работаем, братва

мамкин Data Scientist

07 Jan, 15:10


​​Здорова, племя

Рождественское чудо, сучары, батя вернулся. Ну и конечно, как полагается эталонному бате, я вышел за хлебом на 2 года, с кем не бывает. Тем не менее мы снова вместе, я благодарен каждому Мамкиному DSу, который до сих пор в банде. Спасибо всем, кто писал, читал, ждал, вы лучшие. Ожидание непременно окупится, нас ждет адский разъеб. Садись, слушай

Куда я пропал, мелькнув плащом, на 2 года пока опустим, напишу об этом отельный пост. Остановимся на том, что имеем сейчас. Щас чуть повыебываюсь, потом будет понятно зачем

1. С 2022 года наша команда преподает в Центре Математических Финансов ВШЭ. Если коротко, ЦМФ — это единственное русскоязычное место, где готовят специалистов связанных с количественными финансами/веб3 и проч. В 22 году мы лидировали проект про Маркет Мейкинг, презентацию курса покажу. В этом году будет что-то другое

Мое ebalo вещает про ММ —> https://www.youtube.com/watch?v=VwLe3tBl4fM&ab_channel=CMF

2. За эти два года мы организовали хедж фонд, где я занимаю позицию Head of Trading. Поэтому теперь вместо посещения микрозаймов рядом с падиком, пиши мне, что-нибудь придумаем

Hardcore Labs —> https://hcl.finance/

Так, тут разобрались, теперь самое жаркое, что будет на канале:
1. Конечно же будут обновлены пайплайны входа в ДС/МЛ, они и сейчас ничего, но появились и новые материалы
2. Будет подготовка к поступлению в ЦМФ, школа бесплатная, но tupoy не поступит
3. Конечно же подготовка к собесам DS/ML/Quant. За это время я прожарил на собесах достаточно людей, чтоб определить слабые места, все поправим
4. Принципиально обновится сервис с вопросами и ответами (сейчас Гугл помечает его как фишинговый, не ебу почему). На данный момент удалось собрать 500+ вопросов с собесов, которые будут опубликованы. Если среди нас есть толковый веб-разраб, напиши в личку, сделаем охуенный продукт
5. На канале будут публиковаться вакансии к нам в Hardcore
6. Ну и конечно, джентльменский набор, крутые фишки, которые юзаются в повседневной работе
7. Подписывайся на Твитер, там будет про квантовую индустрию, альфы, кейсы

Чего не будет, так это ебучей рекламы, bablo есть и так

Всех обнял, пристегиваемся

Работаем, братва

мамкин Data Scientist

15 Dec, 15:00


​​Бонджорно, сучары

Нужны ли алгоритмы и структуры данных Data Scientist-у. Тема очень интересная, но вот только какая разница, если тебя уже пятый собес подряд опрокидывают через huy вопросом про бинпоиск? Хочешь жить — умей вертеться, на интервью придется конкурировать с чуваками, которые перекатывается в ДС из разработки, они на память могут написать больше сортировок, чем тебе давали за всю жизнь (>=1)

Но не все так плохо. У нас уже есть пара ресурсов, писал о них раньше. Но нет структуры. Проведя соц опрос среди людей, которые дрючат таких как ты в маленьких переговорах, выделил основные темы и подобрал под них соответствующие задачи.

Табличка еще неполная, будет дополняться со временем. Правда с выходом киберпанка это может затянуться, пацаны. Пробежимся по содержанию.

Топ-4 любимых темы на собесах:
1. Поиск
2. Сортировка
3. Стек
4. Динамика

С поиском и сортировкой все понятно, а вот как же, блять, они обожают стек и всякие строчные алгоритмы с ним, это отдельная история. Хлебом не корми, дай скобочную последовательность спросить. Тут надо быть особенно внимательным. С динамикой тоже все понятно, неспособность решить простую задачку будет характеризовать тебя как ебанько 80 левела.

Пока что все оформлено топорно — в виде Гугл таблицы с названием задач и ссылками на литкод, информацикс, хакерранк. Дальше придумаю как это пиздато прикрутить к нашему сервису interview-mds.ru. Таблица будет расширяться, это не все даже базовые темы, в ближайшее время добавлю задачи на связные списки и хэш-таблицы.

Чек-лист алгоритмов → https://docs.google.com/spreadsheets/d/1kFhOcB5vO8p4TOgxZO_szfO9V-lPCCt6RKIixukGTvc/edit?usp=sharing

Это не просто задачи с потолка, а то, что реально дают на позицию ДС/МЛ.

Хватит ныть про ненужность алгоритмов для ДС, просто ебашь.

Работаем, братва

мамкин Data Scientist

02 Nov, 15:01


​​Здорова, бандиты

Сколько раз нужно подкинуть монетку, чтобы выпало два орла подряд? Не знаешь? А сколько анальных шариков влезает в Боинг 737? Тоже нет? Ну все, начальник отдела задетектил тебя как тупое быдло.

Задачи такого рода имеют много названий, мы будем называть их брейнтизерами. Такое очень любят спросить на финальных этапах отбора, когда базар идет уже с руководителем. Пару примеров на русском можно найти тут.

Короче, давай по факту. Стоит ли основательно готовиться к подобным вещам? Нет.
Если ты tupoy и не можешь с ходу решать такие штуки, то для тебя есть тру вей, как не лохануться на собесе. Погнали.

1. Не молчи. Самый плохой расклад — это молчать или еще хуже сказать: «Я не знаю». Спиздани хоть что-то умное.

2. Хорошая новость заключается в том, что типов брейнтизеров ограниченное количество. Типовые головоломки внутри себя имеют плюс-минус похожее решение. Большую часть конструкторов, по которым собираются брейнтизеры, можно найти вот тут.

Конструкторы → https://www.themuse.com/advice/7-insane-brain-teasers-you-could-actually-encounter-in-an-interview

3. Также есть куча книг, где описывается как решать подобные задачи, но нам че делать нехуй, читать литературу про фасовку анальных шариков в самолеты? Мы сделаем вот как, подписываемся на два ютуб канала и смотрим новые видосы, как только они выходят.
Первый — про классические головоломки
Второй — про числовые задачки

Первый → https://www.youtube.com/c/LOGICALLYYOURS
Второй → https://www.youtube.com/user/MindYourDecisions

Все. Следуя трем несложным пунктам, станешь королем брейнтизеров, а интервьюер будет думать, что перед ним интеллектуал, но на самом деле тот же бродяга, только подготовленный.

Подготовка — 80% успеха, работаем, братва.

мамкин Data Scientist

05 Oct, 09:01


​​Здорова, бродяги

Сидим мы как-то с Толей Карповым, пьем пивчанское, базарим, тут он говорит.
- Саня, запускаю курс по аналитике, сделали огонь, обмолвись в канале парой слов.
- Не могу, Толян, правила для всех одинаковые, что не смотрел, то не рекомендую.

Ну Толя парень простой, взял и подписал на первый поток специализации по Аналитике данных. И вот, блять, спустя 5 месяцев писания SQL запросов и проведения A/B тестов, я готов, замолвить словечко.

Для начала обозначу, что этот курс не про Data science, а про Аналитику. Если ты хочешь быть именно аналитиком, то ок, если ресечером в лабе, то Воронцов в роли доминантрикс ждет тебя на ютубе.

Толя реально понимает для кого сделал этот курс и прекрасно помнит первую неделю работы ВКонтакте, поэтому курс практически имитирует реальную деятельность аналитика и покрывает сложности первых задач, прилетающих от тимлида.

Если ты tupoy или только вкатываешься в профессию, то это однозначно твой вариант.

Ладно, хорош пиздеть, давай по делу. Пять месяцев ты будешь слушать следующие темы: Python с нуля, но сразу ориентированный на аналитику данных, SQL с нуля, Git c нуля, Airflow, Статистика, A/B тесты, Продуктовая аналитика и софт-скилл. Может быть даже додиком перестанешь быть, а то и с бабой познакомишься. Каждая из этих тем приправлена живым разбором сложных моментов, а также мини-проектом, симулирующим(как твоя девушка) реальную работу.

Плюс за бокалом роскошной Балтики 9, Толян дал промокод: MAMKINDS, на скидку 5к. Так что если твой путь лежит в аналитику с нуля, то залетай, у ребят новый набор.

Промокод → MAMKINDS
Курс → Аналитика данных

Работаем, братва

мамкин Data Scientist

22 Sep, 15:00


​​Здорова, бандиты

Стал замечать рост вакансий связанных с временными рядами, особенно радует интерес корпораций к стажерам на это направление. Тайм сириасы одно из немногих направлений, где МЛ не притянут за huy, перфоманс там реально есть.

Вот только у нубов есть одна критическая ошибка, они пытаются заботать SOTA результаты в области, не сформировав твердую базу. Пусть то временные ряды или другая подобласть МЛ.

Братан, когда приходишь на стажера/джуна, выглядит как минимум стремно слушать про Diffusion Convolutional Recurrent Neural Network и при этом видеть удивленное ebalo при просьбе рассказать идею heapsort.

На какое бы направление МЛ ты не шел, нужно знать следующие вещи:
1. База по алгоритмам
2. База по теор.веру/статам
3. База по классическому МЛ
4. База по направлению. База блять, понял?

Базу по Тайм сириасам можно получить на семидневном мини-курсе. Он покрывает все основные моменты, которые могут спросить джуна/стажера.

Курс → https://machinelearningmastery.com/time-series-forecasting-python-mini-course/

Либо, можно совместить приятное с полезным и выполняя третий пункт из списка, взять спецуху от Яндекса/МФТИ, где на пятом курсе рассказывают основы анализа временных рядов, этого будет достаточно для старта. Можно также посмотреть отдельно эту часть специализации.

Курс → https://www.coursera.org/learn/data-analysis-applications

Первые три пункта можно подобрать под себя в первой и второй частях закрепа. Тут главное понять, что основной упор интервьюера будет направлен именно на них. Ну и, конечно, сверху все нужно шлифануть вопросами с сервиса, который мы сделали общими усилиями мамкиных ДСов.

Вопросы с собесов → https://interview-mds.ru/

А если тайм сириас для тебя рабочая рутина, то следующий продукт порадует. Четыре недели временных рядов на TensorFlow от deeplearning.ai. Тут и DNN, и RNN, все как мы любим. Ведущий — дядька из Google Brain, не предложит выбор из двух стульев, а посадит на каждый из них по очереди. Короче 10 из 10.

Курс → https://www.coursera.org/professional-certificates/tensorflow-in-practice

Работаем, братва

мамкин Data Scientist

24 Aug, 15:00


​​Здорова, пацаны

Сегодня будет тема для ученных в говне моченых (работяги вышли из чата). Короче, если в вакансии на которую ты подаешься есть слова типа scientist, или, если с противоположным полом совсем плохо, то можно увидеть даже researcher. Тут исход один. Рано или поздно тебя попросят либо реализовать научную статью целиком, либо какую-то часть, либо же вообще улучшить результат. Чтобы при такой просьбе тебя не перекосоебило, надо понимать следующие вещи.

Первое. Хоть сначала кажется, что некоторые статьи написаны чужими для хищников, это не так. Тут дело практики, как и в любом деле, если читать по 5-10 статей в неделю, то будешь расчехлять их за O(1).

Второе. Если не понимаешь статью от слова совсем, скорей всего проблема в статье. Ты, конечно, tupoy, но иногда поиск хорошей статьи по теме превращается в настоящий челендж. Так что если не понимаешь, забиваешь, идешь дальше.

Третье. Исследовательские статьи не только для PhD MIT. Ты можешь точно так же читать статьи и абсолютно не бояться этого. Там есть определённый формальный язык, но когда к нему привыкаешь, то читаешь как ленту новостей.

Лан, хорош пиздеть, теперь по ресурсам. Определенного алгоритма у меня нет. Но можно почитать, что говорят другие люди
https://www.sciencemag.org/careers/2016/03/how-seriously-read-scientific-paper

Начать поиск статей лучше всего здесь, думаю и так знаешь.
Google scholar → https://scholar.google.com/
Также не забывай искать на гитхабе по названию статьи, иногда можно найти хороший код.

А вот, что порекомендовал бы к просмотру, так это как 4хГрандмастер каггла (это не шарагу закончить), реализует классический U-Net. Из этого видео понятно, что если статья хорошая, то она и реализуется просто. Что написано, то и кодим. Обязательно к просмотру.
Implementing original U-Net → https://www.youtube.com/watch?v=u1loyDCoGbE&t=1s

Работаем, братва

мамкин Data Scientist

28 Jul, 15:01


​​Здорова, бандиты

Если бы мне платили 1$ за каждый вопрос: «А можно изучать математику не по разным источникам, а найти один, где бы была Математика для МЛ», то я бы нихуя не заработал, но было бы приятно. Ответ очень простой, да, такие есть. Слышал у физтеха есть такой курс, у степика что-то там разрабатывается и еще пару контор. Но давайте проясним пару вещей. Ты, конечно, tupoy и не понимаешь этого, но математика для МЛ ничем не отличается от Математики для экзамена на втором курсе (вот это поворот). Все темы известны, никаких секретов, информация в свободном доступе уже миллион лет.

Смоделируем две ситуации.
Первая, ты смотришь курс математика для МЛ до того, как изучил МЛ/ДС. Ну тогда какая нахрен разница, что собственные векторы используются в PCA, если ты не понимаешь что такое PCA, а если даже понимаешь, то не понимаешь сути как это работает в МЛ и зачем. С таким же успехом можешь просто прогнать все эти темы, без уклона на МЛ/ДС и никакой разницы не почувствуешь.
Вторая ситуация, ты смотришь подобный курс после того, как изучил МЛ и просто хочешь понять более детально как это все работает. Ну тогда зачем использовать подобный продукт, если ты уже и так понимаешь какие темы там под капотом, посмотри сразу их.

Хоть смысла, кроме как мотивационного пинка, в подобном продукте я не вижу, давайте сделаем вот как, есть один неплохой бесплатный курс математика для МЛ на английском. Там 26 видео в среднем по часу, как раз можно понять, каким темам нужно уделить особое внимание, выстроить программу именно под себя и охуительно заботать. Либо просто следовать пайплайнам из закрепа. Тяжело? Легко никто не обещал, 300кк/сек просто так не платят.

Курс → https://www.youtube.com/playlist?list=PL7y-1rk2cCsAqRtWoZ95z-GMcecVG5mzA

Работаем, братва

мамкин Data Scientist

06 Jul, 15:14


​​Давай по новой, Миша. Всё хуйня!

Короче, бандиты, я полностью пересмотрел смысл и содержание закреплённого поста. Теперь там собраны основные пайплайны обучения, некоторые советы, а также обновлена навигация по каналу. У нас с вами тут уже целая эко мать ее система на минималках. Будь внимателен, закреп большой, поэтому он в двух частях, друг под другом.

Важно вот что понять. Курсов много, хочется все посмотреть, но буст, который ты получаешь от практики aka Галеры, гораздо сильнее, чем от любого курса. Старайся получить хорошую базу, которая описывается в пайплайнах, а затем сразу садиться за весла. На практике люди залетают на работу даже без знания DL, а потом уже доучивают его в процессе. В этом деле главное не ссать и пробовать свои силы при каждой возможности.

Смотрим закреп, если есть новые идеи, смело пишем @BoykoAA

Закреп → https://t.me/mommyscience/14

Работаем, братва

мамкин Data Scientist

10 Jun, 15:01


​​Бонджорно, сучары

Количество мамкиных ДСов на рынке работорговли растет по экспоненте, поэтому растут и требования к ним. Иногда встречаю вакансии джунов и диву даюсь. Думаю, ебать че навыдумывали. Это конечно не значит, что надо на все забить. Это значит, что надо быть гибким и уметь подстраиваться под изменяющейся рынок. Тем более, что там больше слов, чем дела.

Короче тема такая, допустим ты обучил модельку в джупитер ноутбуке, и она даже отличает кошу от собаки лучше твоего бухого соседа. Что делать дальше? Дальше нужно деплоить. А вот как это делать и есть новый тренд у работодателей. Да и вообще, способность завести свою модельку где-то кроме джупитера, сделать ей веб-морду и тд, крайне полезный скил для самого себя.

Научиться этому есть два способа. Путь мамкиного ДСа и нормальный.
К первому относится схема «решаем проблему по мере ее поступления». На ютубе есть отличный не то чтобы по вкусу курс, но по сути курс. Представляет собой скорей практическое руководство, которое может по шагам показать как делается деплой. Не надо бежать смотреть это с отрывом от реальной задачи, один хрен у тебя память как у рыбы, забудешь все послезавтра. Когда появится такая задача, тогда и посмотришь. Как говорится, в резюме пишем, ссылку запоминаем.

Руководство → https://www.youtube.com/playlist?list=PLQJ7ptkRY-xYLEAC5Y_sKqrJ9RA-U7Dja

Если ты больной на голову, то есть и фундаментальный вариант. Это целый курс на Udemy. Конечно, он эффективней, но надо понимать, что это целая история, и затянется она не на 2 вечера. Оверкильный вариант, но есть такие додики, которым нужен везде основательный подход, поэтому решать тебе

Курс → https://www.udemy.com/course/learn-devops-the-complete-kubernetes-course/

Идем до конца. Работаем, братва

мамкин Data Scientist

20 May, 09:02


​​Здорова, бандиты

Ситуация: на собеседовании интервьюер вскользь задевает командную строку, интересуясь о твоих познаниях и опыту работы с этим инструментом. Конечно же с ехидной улыбкой отвечаешь, что все в порядке, а сам на деле ты ебанько подай патроны и никогда в жизни что-то круче чем $mkdir bigtits не делал. Исправляем ситуацию.

Вообще командной строке посвящают какое-то время на нормальных CS специальностях в универе, но какую шарагу ты закончил мы знаем, поэтому надо взять что-то со стороны.
MIT любезно поделились своим курсом и домашками, которые полностью покроют потребности в командой строке при трудоустройстве. Да и стыдно знать МЛ, но не уметь пользоваться шеллом.
Тут 11 лекций и столько же домашек. Это не рокет сайнс, пацаны, поэтому все можно схавать за неделю не напрягаясь.

Shell MIT → https://missing.csail.mit.edu/

Второе, про что хочется сказать это SQL. Еще ничего так легко не понижало стоимость мамкиного DSа на рынке как эта сучка. Но тут больше разговоров, просто берем и задрачиваем. Уже сделали кучу тренажеров, которые требует только твоего времени. И если до сих пор не знаешь SQL, то посвяти блять вечера тренажерам, а не новым сезонам очередной параши.
Вот что рекомендую. Можно взять бесплатный тренажер на степике: 4 блока, 20 часов на изучение, стильно, модно, молодежно.

Тренажер степик → https://stepik.org/course/63054/promo

А можно взять sqlzoo, общепризнанного фаворита. Попробуй оба варианта, какой ближе ляжет тот и проходи. В любом случае результат будет хороший

sqlzoo → https://sqlzoo.net/

Выполнив эти 2 простых пункта ты повысишь свою стоимость, увеличишь покрытие вакансий, а главное сделаешь наконец, то что давно хотел.

Работаем, братва

мамкин Data Scientist

29 Apr, 09:01


​​Здорова, пацаны

Короче тема такая, каждое второе сообщение у меня в личке, это что-то вроде: «хорош ли курс %name%». Это отличный вопрос, обязательно напишите мне или кому-то типа меня перед тем как покупать курс за хуево-тутуево кэша.
Но вот в чем дело, я никогда не посоветую курс, который сам хотя бы не смотрел, а они плодятся со скоростью света. В таких ситуациях, советую взять что-то проверенное. Потому что база у МЛ одна, ничего сверхъестественного там не расскажут.
Конечно иногда на меня накатывает волна филантропии, тогда я даю шанс непроверенным продуктам (как ты в ашане) и покупаю их. Но пока что меня ждал сплошной пиздец.
Тем более, у нас уже выделено 3 программы по классик МЛ, которые с головой покрывают базовый объем информации, как теоретической, так и практической, за них могу ручаться: спецуха, одс, институт биоинформатики + одс.

А сегодня к этой тройке добавляется, прямо-таки неебовый конкурент. Свежий курс от физтеха. Причем в двух вариациях: базовый уровень и продвинутый. Базовый уровень — это ровно тот курс лекций и домашек, который прослушивают студенты физтеха на третьем курсе, а продвинутый на четвертом.

Пару слов. Это абсолютно самостоятельный продукт, его не нужно дополнять какой-то дополнительной домашкой или лекциями, если конечно бекграунд соответствует. Просмотрев базовую версию и выполнив 80% домашек, а также докинув сюда 1-2 соревнования на Kaggle, ты будешь готов ебать мозги всей Москве и мозолить глаза hr-ам разных компаний.

Быстро по структуре. Сюрпризов не будет, все по классике. 13 недель. Линейные модели, деревья, бустинги, хуюстинги, немного нейронок.

Что касается продвинутого курса, оно того стоит, пацаны, смотрим. Некоторые ноутбуки даже просто прощелкать будет полезно. Короче мастхев. Просто глянь список лекций, возможно прослушать 1-2 будет самый сок для тебя, а не проходить весь курс.

По нашей стандартной метрике тобi пiзда / качество — 9/10 для базового, из-за достаточно высокого порога входа. И 10/10 для продвинутого, тут люди к боли привыкшие.

Курсы → https://github.com/ml-mipt/ml-mipt

Ботаем, братва

мамкин Data Scientist

10 Apr, 15:01


​​Здорова, ученые в говне моченые

Как и обещал, подготовил вам подгон на карантин не хуже порнохабовского. Помните наш с вами совместный проект Interview_mds? Это сервис, где каждый мамкин DS может поделиться вопросами, которые пускали его по кругу во время очередного собеседования. Если мы будем сознательно подходить к этому делу, то удивленное ebalo на интервью станет редким событием.

Так вот, на днях мы с пацанами посидели в позе голландского штурвала и добавили жизни в проект, а именно ответили почти на 70 вопросов. Лучшего времени подготовиться к новым собесам вряд ли когда-то представится. Поэтому собирай свою дряблую жопу в кулак и вперед ботать.

Вопросы, на которые подготовили ответы, я собрал в отдельном файле с линками, их можно найти здесь.

Вопросы + ответы → https://docs.google.com/document/d/1eeP6R36Ur7aTFica7uBkx8FlaQKSE8dHamdnoAJCVUM/edit?usp=sharing

Не благодари, бро, лучше сделай вот что, перейди по ссылке ниже и скажи, что ты вообще думаешь о Interview-mds. Что нравится, что не нравится, что поменять, что добавить и не ленись блять, пожалуйста.

Предложения → https://docs.google.com/forms/d/e/1FAIpQLScp7b9sImC7oL5GooONM68LRZC5BGiCjyOzmXS-aCiZQIzKbg/viewform?usp=sf_link

Работаем дома, братва