Kantor.AI

@kantor_ai


Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных

Kantor.AI

20 Oct, 10:05


Немного об итогах опроса

Зачем вообще я его проводил
В разные моменты карьеры мне посчастливилось заниматься всеми перечисленными задачами: многими своими руками, другими - в рамках задач моих подразделений. Это привело к тому, что я давно хотел сделать достаточно исчерпывающий курс по приложениям ML в бизнесе. Мы с Никитой Зелинским (CDS из Big Data МТС) провели первый такой курс весной в МФТИ и ВШЭ и сейчас готовим к запуску адаптированную версию у нас в школе MLinside.

Но одно дело наполнить курс на основе своего опыта и ранжирования задач по экономическому эффекту для бизнеса, и совершенно другое - узнать, а какие задачи ML видят вокруг люди. И здесь было несколько интересных открытий.

Больше денег - меньше хайпа
Самой редко вспоминаемой оказалась история про оптимизацию затрат, которая часто приносит огромный эффект в деньгах. Например, если у вас есть бюджет в 5, 10, 50, 100 млрд рублей в год на расширение сети магазинов в ритейле, базовых станций в телекоме, банкоматов в банке, оптимизация на несколько процентов уже дает огромный эффект в абсолюте.

Работает это так: вы строите модель, которая прогнозирует эффект, а дальше решаете задачу оптимизации поверх этих прогнозов. Иногда оптимизация простая часть и решение строится жадным алгоритмом, а иногда требуется что-то посложнее, но прогнозная модель в основе решения как правило остается. Самые дотошные могут заметить, что сравнивать эффект нужно не с отсутствием оптимизации, а с оптимизацией без ML, но даже так эффекты остаются большими за счет масштаба задачи.

Много хайпа - не очень много денег
Чаще всего вспоминали рекомендательные системы и поиск. В случае с поиском есть конечно небольшое количество компаний в мире, которые нашли там сверхприбыли (и то за счет рекламы), для остальных же поиск не сильно денежная вещь в плане эффектов. Что касается рекомендаций, то даже обожаемый всеми Netflix никогда не репортил публично (на моей памяти, буду рад, если кто-то поправит) эффект от рекомендаций больше 4% от своей выручки. На практике же даже в ритейле подтвержденный A/B тестами эффект в 1-2% на количество покупок и отсутствие статзначимого эффекта на выручку - вполне стандартная история. Конечно, если посчитать какой-нибудь last-click/first-click без учета каннибализации, элементарно нарисовать двузначные эффекты в процентах, а без А/В или с «грамотно организованным» вообще можно показать любые числа. Одна проблема - бизнес больше зарабатывать от этих упражнений в счете не станет.

В чем же секрет популярности рекомендательных систем? Я думаю в том, что мы любим делать то, что любим, а не то, что больше всего надо. В рекомендациях есть где развернуться - тут вам и матричные разложения, и факторизационные машины, и бустинги, и сетки, и reinforcement learning, да и A/B сразу надо учиться быстро проводить. Короче, очень интересно. Не буду отрицать, что я бы сам из всего перечисленного выбрал бы заниматься рекомендациями (и часто выбирал :)). Но к определенному перекосу в восприятии эффектов Data Scientist’ами развитость рекомендательных систем точно приводит.

Опять же, самые дотошные скажут, что таргетирование рекламы это те же рекомендации с правильным взвешиванием, и будут правы. Так что конечно получить большие эффекты можно, но на масштабах всего CRM в компании или в рекламном бизнесе.

Еще одно очень важное наблюдение: рекомендации в контентных сервисах это то, без чего сейчас не получится быть конкурентоспособным. В наше время это базовый инструмент взаимодействия с контентом наряду с поиском, поэтому тут хороший вопрос, что считать эффектом, когда весь бизнес без хороших рекомендаций становится бессмысленным. Ну представьте TikTok без рекомендаций - шляпа какая-то :) Так что с рекомендациями и поиском все сложно: вроде если попытаться посчитать, получается совсем не восторг, а если подумать, часто без них и вообще нельзя.

С остальными задачами тоже есть, что обсудить, но эти поля слишком узки, и кажется я уже приближаюсь к лимиту на длину поста

#ML_in_business

Kantor.AI

17 Oct, 15:50


🎉Подкаст про машинное обучение с Женей Соколовым вышел, лайк, подписка, репост :)))

🔥Посмотрите хотя бы только на тайм-коды, чтобы оценить, каким насыщенным вышел диалог:

0:00 - Искусственный интеллект, машинное обучение и data science
3:42 - Начало ML и должен ли ИИ подражать человеку
15:39 - Что не получалось: обучение нейросетей и экспертные системы
20:40 - Классические методы ML
24:42 - ML в играх
28:01 - Как ML спасает жизни
34:39 - Как ML зарабатывает деньги компаниям
40:42 - Возвращение нейросетей: Deep Learning
49:23 - Свёрточные нейросети, рекуррентные нейросети и трансформеры
54:21 - Генеративно-состязательные нейросети
57:01 - Какое оборудование нужно для ML
1:01:48 - Хорошо ли живется специалистам в машинном обучении
1:05:45 - Прогнозы на будущее и подготовка кадров


Смотреть тут: https://youtu.be/q740GwAd9fU?si=iFjFaePGWTKeWCla

Kantor.AI

16 Oct, 12:52


Машинное обучение | Евгений Соколов в подкасте ТехТок

📺 Наконец-то завел на YouTube канал подкаста ТехТок, начинаем выкладывать второй сезон. Одна тема - один гость, посвятивший ей значимую часть своей карьеры и объясняющий на широкую аудиторию, что же это такое, как развивалось, и в каком состоянии технология сейчас.

🧠 Первый выпуск про машинное обучение в целом, в гостях прекраснейший лектор на свете - Женя Соколов. Тизер: https://youtu.be/T7dyUb6Dxqg?si=eFsOqH_ObuIUlcrr

❗️Сам подкаст выйдет на канале завтра в 18:00

Kantor.AI

13 Oct, 10:51


Об индивидуальности понятия «хороший курс»

Однажды мы проводили очную встречу со студентами нашей специализации по ML на Coursera. Ко мне подошел один парень и спросил: почему в России, когда обучают ML, выливают на студента несколько ведер математики, это же совершенно невыносимо. Там именно было сравнение, что вот в западных курсах в течение курса выливают по чашечке, а в Российских вообще не щадят.

Я удивился, наш первый курс был введением в математику и Python, но не то чтобы там было много всего и сложно (на мой судъективный взгляд), наоборот старались облегчить. В ответ на мое удивление парень сказал, что конечно у нас очень много математики, но все равно курс лучше, чем другие курсы по ML на Курсере. Я опять же поинтересовался, а чем же ему самый первый курсеровский курс не угодил (авторства Andrew Ng). Получил шедевральный ответ: да курс вообще дно, там какой-то кореец его читает

Когда я, ошалев от ситуации, сказал что это стенфордский профессор и основатель Курсеры, парень смутился и растворился под хохот толпы других задававших вопросы

Но для себя я запомнил на всю жизнь, что для некоторых людей хороший курс, это когда читает не кореец. Так что нужно быть очень внимательным к оценкам каких-либо курсов слушателями - аргументация, если ее попросить, может вас сильно удивить :)))

#образование

Kantor.AI

11 Oct, 11:59


«Человек с физтеха вам не всегда поможет войти в IT. Он с седьмого класса мыслит математическими абстракциями. Если вы так не делаете, вам нужен тот, кто прошел этот путь самостоятельно», — рассуждает сооснователь karpov.courses Михаил Серегин, выпускник психфака МГУ и номинант рейтинга Forbes «30 до 30». Основанная им, его другом Бесланом Курашовым и тоже выпускником психфака Анатолием Карповым школа стала лидером в нише обучения data science, или науке о данных — области, в основе которой анализ больших массивов информации и создание моделей, например для прогнозирования спроса.

С 2020 по 2023 год выручка karpov.courses выросла с 18 млн до 417 млн рублей, а среди клиентов появились корпорации, которые готовы платить за обучение своих сотрудников востребованным навыкам работы с данными.

Теперь основатели думают о выходе в новые ниши и обсуждают слияние со стратегическими инвесторами.

О том, как выпускники психфака создали заметную школу data science, читайте на сайте Forbes

📸: Анатолий Карпов (Фото DR)

Kantor.AI

11 Oct, 11:59


Польщен вниманием к обучению «от человека с Физтеха», при том что мы запустили MLinside меньше месяца назад и учим только первую группу студентов, а Karpov.Courses работает уже несколько лет 😂

Но, как говорится, лучше с 7 класса мыслить формулами, чем мыслить формулами из 7 класса :)

Kantor.AI

09 Oct, 10:25


Еще одна Нобелевка за AI

Кто-то шутил, а кто-то серьезно предполагал, что Нобелевскую премию по химии теперь дадут за AlphaFold. Ну что же, так и произошло: https://naked-science.ru/article/chemistry/nobelevka-po-himii-2024

Коллеги, поздравляю :) Теперь, занимаясь AI, не обязательно оставлять надежды на Нобелевку по естественным наукам 😁 И если Хинтон это пример, когда человек совершает эпические подвиги в науке уже много десятков лет, то AlphaFold показывает, что и прямо сейчас можно что-то крутое прикладное сделать и вскоре получить признание.

Думаю дальше у специалистов в AI будет становиться только больше и больше возможностей для самореализации.

Kantor.AI

08 Oct, 11:22


Нобелевка за нейронки

Нобелевскую премию по физике выиграли Джеффри Хинтон и Джон Хопфилд. Премию присудили за "Фундаментальные открытия и изобретения, которые способствуют машинному обучению с искусственными нейронными сетями". При чём здесь физика - сложно понять. Похоже, комитет просто пытался хоть куда-то приткнуть нейронки, а физика тут ближе всего. Хотя, по-моему, тут больше бы подошла даже медицина - там хотя бы AlphaFold совершил прорыв в чём-то, а с открытиями в области физики из-за нейронок как-то негусто.

Возможно, причина в том, что Хопфилд всё-таки по образованию физик. Хотя его основной вклад в науку - изобретение сетей Хопфилда, рекуррентных сетей, которые во многом положили начало возрождению нейронных сетей в 80-х и 90-х.

Хинтон изобрёл метод обратного распространения ошибки для тренировки нейронок, который позволил тренировать многослойные сети. А студенты Хинтона - Илья Суцкевер и Алекс Крижевский, создали AlexNet. Именно она начала всю эту гонку нейронок, показав, что их можно масштабировать через тренировку на GPU.

В общем, хайп по нейронкам теперь проник и в Нобелевский комитет.

@ai_newz

Kantor.AI

08 Oct, 11:22


Теперь Хинтон не только отец Deep Learning, но и Нобелевский лауреат 🔥

Kantor.AI

07 Oct, 15:13


#карьера
Правило трех гвоздей

Опытные сотрудники больших организаций (и особенно опытные руководители, у которых есть свое высшее руководство) хорошо знают классическую технику тайм-мендежмента, доставшуюся нам еще от наших дедов. Называется она "правило трех гвоздей".

Восходит она к байке про особенно успешного председателя колхоза, которого однажды спросили, как ему много лет удается справляться со своей работой. В ответ председатель указал на стену и торчащие в ней три гвоздя. Когда распоряжение приходило первый раз, он вешал его на первый гвоздь, когда приходило напоминание - перевешивал на второй, второе напоминание - на третий, и только распоряжения с третьего гвоздя он начинал исполнять. По словам председателя колхоза, большинство заданий руководства не доходило даже до второго гвоздя.

В наше время активных лидеров, трансформирующих большие организации и наводящих суету своей бьющей ключем энергией, адептов правила трех гвоздей не жалуют. И тяжело раскачиваются, и медленно как-то, да и что это вообще значит, что не побежали сразу исполнять, когда было дано задание. Часто такие сотрудники ассоциируются как раз с тем самым "болотцем", кому бы только чаи гонять и на перекуры ходить. Но суть лежит немножко глубже, достаточно посмотреть на все глазами сотрудника. Если вы просите человека что-то сделать, но потом никогда не спрашиваете результат, или спрашиваете через полгода, человек, потративший на это силы, не получает внимания к результатам своего труда. Это обесценивает его работу, появляется чувство "работы в стол". А в стол работать никто не любит, прям совсем никто. Три гвоздя - это естественная защитная реакция.

Вывод очень простой: если не нравятся сотрудники, работающие по правилу трех гвоздей, то придерживайтесь правила "поставил задачу - будь готов принять сделанную работу".

Kantor.AI

06 Oct, 15:28


▪️От ночного сисадмина до фаундера стартапа с оценкой в десятки $ млн,
▪️Об уходе из Яндекса и открытии своего стартапа,
▪️О плюсах и минусах работы в больших компаниях и много другом.

Интервью с Эмели Драль выйдет сегодня в 20:00 по мск на нашем youtube-канале.

🔔Подписывайтесь и ставьте колокольчик, чтобы не пропустить новое видео!

Kantor.AI

06 Oct, 15:28


Интервью с Эмели Драль
CTO & Founder Evidently AI, со-автор нашей специализации «Машинное обучение и анализ данных» от МФТИ и Яндекса на Coursera и курса Data Mining in Action - сегодня в 20:00 на канале школы машинного обучения MLinside 🎉

UPD: Уже на канале: https://youtu.be/hnDhLdH40xo?si=3uQvVXbclzptYBU6

Kantor.AI

02 Oct, 08:58


К слову о Forbes

К слову о Forbes, который я вчера радостно цитировал. Подписывайтесь на каналы людей из списка Forbes 🤩: https://t.me/addlist/NrULL8pvfjRiMjAy

В 2021 году я стал наверно первым Data Scientist’ом в России на обложке Форбса, и все благодаря тому, что в Россию тогда год как пришел рейтинг Forbes 30 до 30. Его задумка в том, чтобы писать в журнале не только про миллиардеров, но и про амбициозную молодежь, у которой уже что-то крутое получилось, и есть план не останавливаться на достигнутом :) Далее распишу чуть подробнее, зачем это и кто в этих каналах есть.

💯 Зачем вообще подписываться на этих людей?

Главная ценность в Forbes 30 до 30 – это именно сообщество и люди, которые туда попадают – очень талантливые и разносторонние, неравнодушные и амбициозные. Люди, которые могут служить вдохновением для других не только за счет результатов, но и просто своим характером и личными качествами.

Сегодня мы как раз делимся с вами частичкой русскоязычного сообщества – папкой каналов участников Forbes 30 до 30. Нас собралось пока 26 человек (но надеюсь скоро будет больше). Все мы увлечены своей областью и будем крайне рады поделиться своим увлечением с вами.

Кого можно привести в качестве примера из этой папки?

Лично мне очень нравятся:

proVenture: канал Дениса Ефремова, принципала R136 Ventures, о венчурных инвестициях, стартапах и предпринимательстве - всегда очень по делу, обстоятельно, но при этом понятно для всех. У Дениса талант писать про венчур интересно

Радостный бизнес: канал Алисы Пейрис, основательницы Holy Corn, про бизнес, который приносит радость и мой любимый самый вкусный попкорн 😁

И, конечно

tldr_tany: ведет Таня Савельева, предприниматель, AI эксперт (а еще моя бывшая студентка на курсе Data Mining in Action и сотрудница в Яндекс.Такси, поэтому радуюсь всем её успехам вдвойне 🫶🏼) - 10 лет назад была AI разработчиком, потом заработала своей компании $20M и сэкономила $100M, увидела в этом идею для бизнеса и стала серийным СЕО AI-стартапов 💪 В канале пишет внезапно все, что думает, что в случае человека с её насыщенностью жизни и карьеры - самое лучшее, рекомендую :)

В папке также есть еще 20+ каналов от крутых ребят, основателей компаний, действующих инвесторов, уникальных ученых с опытом как в России, так и за рубежом.

📂 Чем удобен формат папки? Вы получаете доступ сразу к огромному количеству качественного контента. Конечно, не все окажется для вас подходящим – почитайте, выберете из папки те каналы, которые окажутся для вас наиболее релевантными. Но вам всегда удобно будет вернуться – закладка будет всегда у вас в Telegram.

🔗 Присоединяйтесь к папке по ссылке: https://t.me/addlist/NrULL8pvfjRiMjAy

Kantor.AI

01 Oct, 17:20


К слову говоря, есть точка зрения, что российские паспорта за уши притянули, просто разработку переводят на индийский офис

Kantor.AI

01 Oct, 17:18


Тем временем в чате бывших сотрудников ABBYY весь день

Kantor.AI

01 Oct, 17:18


ABBYY за час уволила почти всех российских разработчиков

Сегодня в Telegram-каналах, соцсети X и некоторых медиа распространилась информация о том, что компания ABBYY AI буквально за час уволила всех граждан России.

Как рассказали Forbes несколько сотрудников компании, принимавших участие в созвонах, на которых им было объявлено об увольнениях (по разным оценкам, от 200 до 300 человек) ситуация развивалась следующим образом.

В воскресенье 29 сентября в 22:30 почти всем сотрудникам пришло письмо про созвон с топ-менеджментом; разным локациям — разное время: Кипр в 15:00, Сербия в 15:30, Венгрия в 16:00. В письме не был виден список участников, но его видно в чате созвона в Teams.

В списке венгерского созвона были только русские сотрудники, эйчары и два C-level сотрудника — руководитель, ответственный за развитие продуктов и технологий (Chief Product & Technology Officer) Патрик Джин (Пи-Джей) и СЕО компании Ульф Перссон. На Кипре и в Сербии ситуация аналогичная. Чат и микрофоны у собрания отключены.

«Понедельник, 10 утра. Ребята из саппорта пишут: им сказали, что все они уволены, и доступы забрали немедленно, — рассказывает один из сотрудников. — Первая половина понедельника: часть ключевых сотрудников говорит, что с ними проводили Skip level-созвоны, на которых были они и руководители второго-третьего уровня без непосредственных, где им сообщали, что они уволены, «это было трудное решение» и т.д. 15:00: «киприотам» рассказывают, что их позиции сократили, офис закрывают. 15:30: «сербам» говорят то же самое про позиции, но не про офис. 16:00: то же самое с «венграми» (позиции, но не офис)».

По данным сотрудников, с которыми поговорил Forbes, вчера сокращены минимум 200 или, по другой оценке, около 300 человек из 500.

Одному из собеседников Forbes на почту пришло «мизерное соглашение» об оплате одного месяца при увольнении и предложение подписать бумагу об отсутствии претензий к компании: «Кому-то пришло за два месяца, кому-то — за несколько недель.

Пока уволенные сотрудники теряются в догадках, почему с ними так поступили. «Объяснений много, все они спекулятивные. Самое простое и, как мне кажется, самое вероятное — режут косты, — говорит один из собеседников Forbes. По мнению бывших сотрудников, компанию готовят к банкротству.

Forbes поговорил с несколькими сотрудниками компании, восстановил хронологию событий и узнал, с чем связано такое решение. Читайте на сайте

📸: Олега Яковлева / RBC / TASS

Kantor.AI

29 Sep, 13:58


Кому нужны джуны

Записывал видео для YouTube, где ищу и комментирую джуновские вакансии на hh.ru. В поиске нашлось 19 вакансий, половина или 2/3 из которых не на джуна. В комментариях ожидаемо пошел смех в духе «ахаха, онлайн-школы выпускают тысячи джунов, а на hh 19 вакансий». Оказалось, что люди не понимают одну важную вещь: джуны вообще НИКОМУ не нужны

Джун нужен только тем, у кого нет денег на миддла, либо у кого не получается быстро нанять миддла с рынка. С крупными компаниями чаще всего происходит второе.

Кто не согласен - попробуйте меня переубедить в комментах :)

Kantor.AI

27 Sep, 15:00


Интервью с junior DS-специалистом МТС и преподавателем школы MLinside Дмитрием Лялиным уже на канале📱

Вы узнаете:
▪️Как подготовиться к собеседованию и найти первую работу в Data Science,
▪️Как справиться с трудностями на старте карьеры,
▪️С какими задачами сталкивается junior DS-специалист,
▪️На какие зарплаты стоит надеяться начинающему дата саентисту,
▪️Какие скиллы необходимы на позиции junior и многое другое.

Приятного просмотра⬇️

https://youtu.be/Gcons0F-iyY?si=SmwIIFWKr7Dshb8y

Kantor.AI

27 Sep, 15:00


Один из принципов, которые мы положили в основу обучения в нашей школе ML, - привлечение к преподаванию специалистов всех уровней. Помимо трех CDO, у нас есть и ребята, которые начали работать DS'ами совсем недавно: еще год назад они сталкивались с теми же проблемами, что и слушатели, поэтому очень хорошо понимают, чем помочь и что посоветовать. Посмотрите интервью с Димой - вышло очень лампово :)