أحدث المنشورات من fmin.xyz (@fminxyz) على Telegram

fmin.xyz

01 Sep, 20:56

2,503

😮

Как заглянуть в стотыщмерное пространство

Количество обучаемых параметров в современных нейронных сетях давно перевалило за миллиард и именно в пространствах такой размерности сегодня люди с разным успехом пытаются искать минимум функции потерь. Существует очень простой способ спроецировать пространство сколько угодно высокой размерности так, чтобы на него можно было взглянуть.

Представьте, что у вас есть набор весов вашей нейронной сети θ (пусть он будет стотыщмерным, как на примере ниже).
Так вот если вы сгенерируете случайный вектор такого же размера w₁ и будете считать значения функции потерь вдоль случайно выбранного направления

L(θ + α w₁),

то сможете построить график L(α), где α - скалярная переменная из наперед заданного отрезка. Это будет называться проекция на случайно выбранное одномерное пространство.

Ниже пример проекции функции потерь простенькой сверточной нейронной сети, обученной на датасете FashionMNIST. Здесь, например, видно, что одна и та же сеть, обученная с дропаутом в одинаковых услових даёт наглядно меньшее различие между train и test. Мы надеемся, что в исходном пространстве большей размерности дела обстоят примерно так же (гарантий нет, но есть кеки, об этом дальше)

fmin.xyz

01 Sep, 20:56

2,311

Хочу поделиться важными новостями.

🌐 Во-первых, на моем ютуб канале недавно образовалась целая тысяча уважаемых подписчиков. Ходить по улицам становится всё тяжелее, а рука уже отсохла от раздачи автографов, но я готов нести бремя селебы ради методов оптимизации 🙄.
В этом учебном году я планирую читать семинары\лекции по оптимизации не только на физтехе. Так что если вам интересно в режиме реального времени участвовать в этих курсах, то подписывайтесь, видосы там будут.

💥 Во-вторых, летом я работал над несколькими важными сюжетами в области образования, часть из них почти доведены до ума. Так что на канале будут посты. Для начала посмотрите на красоту ниже ⬇️

fmin.xyz

08 May, 15:42

3,322

Градиентный спуск для линейной регрессии

Что может быть проще? Однако, я использую эту гифку в качестве иллюстрации для людей, незнакомых с алгоритмами оптимизации как минимизация функции потерь соответствует обучению модели машинного обучения (пускай в ней всего два обучаемых параметра).

🫡 Ссылка на код.
🤔 Статья о постановке задачи оптимизации.

fmin.xyz

08 May, 15:42

3,042

Привет, меня зовут Даня Меркулов.

Я занимаюсь исследованиями в сколтехе и преподаю на физтехе. Я довольно часто читаю лекции для компаний по нейронным сетям и другой прикладной математике. В этом канале хочу выкладывать красивые сюжеты, с которыми сталкиваюсь во время работы.

📹 Канал, куда я выкладываю записи лекций\семинаров.
💎 Сайт, на котором я стараюсь вместе со студентами и другими энтузиастами собирать интересные сюжеты по методам оптимизации.

منشورات fmin.xyz على Telegram

قنوات مشابهة

fmin.xyz

fmin.xyz

fmin.xyz

fmin.xyz