Latest Posts from ML-легушька (@bdatasciencem) on Telegram

ML-легушька Telegram Posts

ML-легушька
Гений, стартапер, плейбой, филантроп
Для связи: @MLfroge
3,018 Subscribers
1,297 Photos
116 Videos
Last Updated 28.02.2025 21:12

Similar Channels

Dealer.AI
8,207 Subscribers
Юля & Ko
1,400 Subscribers

The latest content shared by ML-легушька on Telegram


Восстание машин

Чем отличается лампочка от программиста?
Лампочка перестает работать когда перегорит

Давайте пообщаемся немного. Ссылка для анонимных вопросов:
t.me/questianonbot?start=463607823b

Планы на 14 февраля: работа, спортзал и созвон с научным руководителем

Хватит ронять доллар я теряю деньги в реальном времени😭😭😭

Только что была очень смешная ситуация.
Подхожу на ресепшен в РЭШ, прошу выдать пропуск, показываю паспорт.
Женщина начинает искать. А я же бороду сбрил, она видимо подумала что я студент вышкинский или еще кто.
Добавляю «на преподавателя». У нее было настолько выразительное лицо и фраза «А..» в этот момент. И она уже начинает в другом журнале искать.

Если правильно упорядочить любой набор точек то вы получите AGI за 2 года

Зачем нам вся эта математика бахнем ML все и так заработает. Или нет?
Сегодня разберем следующую 'оптимизационную' задачу. Мы хотим найти максимум ф-ии f на некотором ограниченном домене, при это f отделима от нуля на этом домене и монотонна. В чем же сложность, если f - монотонная ф-ия? В том, что есть дополнительное условие - xf(x) <= b. Существуют задачи в индустрии, на которых завязано много денег и которые формулируются подобным образом. Фактически, нужно решить уравнение xf(x)=b.
Дополнительная проблема в том, что мы не знаем вид функции f, и даже не можем взять ее градиент. Все что мы можем - измерить значение f в некоторой точке. В оптимизации это называется оракулом нулевого порядка. Соответственно, оракул 1ого порядка - знаем значение функции и ее градиента, второго порядка - то же что и ранее + гессиан, и так далее.
Вспомним метод простой итерации. Как он формулируется? Нужно найти сжимающее отображение, которое в итоге будет сходиться к нужной точке. Однако алгоритмически подобрать сжимающее отображение не очень возможно. К счастью, тут его придумать просто.
Например, отображение g(x) = a* x + (1 - a) * b/f(x). Идейно понятно, почему оно сходится к решению - если x слишком большой, тогда b/f(x) < x, и мы его уменьшим, иначе увеличим. На картинке приведено доказательство, почему для этого отображения наше решение - неподвижная точка.
Почему это круто? Ну... Метод сходится геометрически, на практике за 4-5 итераций, что важно, если измерить значение функции f сложно. Подобную тактику можно использовать для подбора гиперпараметров каких-то моделей, если мы идейно представляем, как устроена зависимость лосса от конкретно этого гиперпараметра. Также подобный метод никак не привязан ко времени, и адаптируется, если ф-ия f между итерациями меняется, но не сильно.
Вот так простая математика позволяет зарабатывать деньги. Формальное доказательство что это сжимающее отображение приводить не буду ибо оно немного громоздкое и также следует из свойств метода простой итерации.
Также легко обобщается на стохастический случай, можете попробовать в комментариях :)

Поздравляю всех причастных с днем российской науки!
Сегодня не успел, но завтра выкачу содержательных постов. Будет рассмотрена интересная оптимизационная задача с ограничениями и безградиентным решением.
Поставьте огонек если хотите

Я снова вошел в эру аниме герл