Neural Networks | Нейронные сети @neuro2learn Channel on Telegram

Neural Networks | Нейронные сети

@neuro2learn


Нейронные сети в действии! Обучающие материалы и эксперименты. Также подписывайтесь на группу VK: https://vk.com/neurolearn

📨 Сотрудничество: @thelans

Neural Networks | Нейронные сети (Russian)

Добро пожаловать в канал "Neural Networks | Нейронные сети"! Здесь вы найдете увлекательные материалы о нейронных сетях, их применении и экспериментах. Если вы интересуетесь искусственным интеллектом и машинным обучением, то этот канал точно для вас! Мы предлагаем обучающие материалы, интересные статьи, а также возможность принять участие в экспериментах. Подписывайтесь на нашу группу VK для дополнительного контента и общения: https://vk.com/neurolearn. У нас также есть возможность для сотрудничества, вы можете связаться с нами через личные сообщения по юзернейму @thelans. Присоединяйтесь к нам и углубляйтесь в удивительный мир нейронных сетей!

Neural Networks | Нейронные сети

08 Jan, 06:04


🔥 GitHub Copilot теперь бесплатен в VSCode!

GitHub радует разработчиков, открыв бесплатный доступ к Copilot прямо в VSCode. Теперь пользоваться ИИ-помощником можно без подписки! 🎉
🌐 https://tproger.ru/news/--github-copilot-stal-polnostyu-besplatnym-vnutri-vscode

Что доступно в бесплатном плане? 🎁
- 2000 автодополнений кода в месяц (примерно 80 в день).
- 💬 50 чатов с Copilot.
- 🤖 Доступ к моделям GPT-4o и Claude 3.5 Sonnet.

Новые возможности Copilot 🚀
- 📝 Редактирование нескольких файлов: изменяйте сразу несколько файлов по своему желанию.
- 🔄 Выбор моделей ИИ: переключайтесь между разными моделями для оптимальных результатов.
- 🎙 Голосовой ввод: кодируйте голосом через VSCode Speech.
- 🔧 Помощь в терминале: автоматическое исправление ошибок команд.

Как начать? 🚀
1. 📥 Установите GitHub Copilot в VSCode.
2. 🔑 Войдите в свой аккаунт GitHub.

P.S.: Для российских пользователей Copilot доступен через VPN.

Neural Networks | Нейронные сети

06 Jan, 07:01


🔊 Создавай музыку с SUNO легко и быстро! 🎶

Регистрация и старт: Подпишитесь на бесплатный Basic Plan.

🎼 Создание трека:
- Введите текст в поле "Lyrics".
- Выберите стиль в "Style of Music".
- Укажите название в "Title".
- Нажмите "Create" и наслаждайтесь результатом!

🎵 Результат: Получите 2 великолепных трека.

💡 Право использования:
- Бесплатный тариф: Для некоммерческого использования, права сохраняются у SUNO.
- Платный тариф: Полные права, включая коммерческое использование.

🎤 Музыкальный стиль: Определяет ритм, инструменты и характер вашей музыки.

🎧 Ежедневные возможности: Открывается 50 кредитов в день, что позволяет создать до 10 треков.

Попробуйте SUNO сегодня и создайте свой музыкальный шедевр! 🚀

🌈 Статья о том, как всё устроено: https://habr.com/ru/articles/810187/

#Suno #Музыка #Творчество #МузыкальныйСтиль

Neural Networks | Нейронные сети

04 Jan, 16:07


💡 Генератор музыки SUNO v4:
- 🌌 Глубокая структура композиций: создавайте музыкальные шедевры с уникальными переходами и захватывающими ритмами.
- 🎼 Адаптивный стиль: возможность настроить композицию под любое настроение — от лиричного до динамичного.
- 🔥 Высокая точность воспроизведения: каждая нота звучит с чёткостью и глубиной.

🎵 Пример композиции:
Сейчас вы услышите пример того, на что способна SUNO v4. Закройте глаза и погрузитесь в мир, созданный её виртуозной музыкой.

🌎 https://suno.com/

#музыка #SUNOv4 #искусственныйинтеллект #новаямузыка #творчество

Neural Networks | Нейронные сети

01 Jan, 06:00


🚀 Перспективы ИИ на 2025 год 🧠

ИИ продолжает стремительно изменять наш мир, и 2025 год обещает новые удивительные возможности и инновации! 🔮 Давайте рассмотрим ключевые направления и их влияние на отрасль.

🔍 Фотореализм и визуализация
- Эволюция изображений: ИИ позволяет создавать фотореалистичные изображения, которые сложно отличить от настоящих. К 2025 году такие технологии будут повсеместно применяться в дизайне, моде, рекламе и кино.
- 📸 Применение: Возможности графики откроют новые горизонты для визуальных эффектов и креативных решений.

🎯 Гиперперсонализация
- Адаптация к потребностям: ИИ будет разрабатывать персонализированные рекомендации и предложения для каждого пользователя.
- 👗 Пример: В модной индустрии боты смогут создавать уникальные дизайны одежды на основе предпочтений клиентов.

🎮 Движущаяся графика и анимация
- Интерактивность: ИИ управляет анимацией, создавая динамичные элементы для видеоигр, рекламы и образования.
- 🎮 Пример: Персонажи видеоигр станут ещё более реалистичными и захватывающими благодаря новым технологиям.

🏗️ Генеративный дизайн в архитектуре и моде
- Инновации в дизайне: ИИ станет ключевым игроком в создании уникальных проектов в архитектуре и моде.
- 🏢 Пример: Боты создадут энергоэффективные здания, оптимизируя конструкции и материалы.

🛠️ Инструменты для не-дизайнеров
- Демократизация дизайна: ИИ упрощает процесс создания для всех. Благодаря инструментам на базе AI, каждый сможет разрабатывать профессиональные графики и видео.
- 🎨 Пример: Платформа Canva уже показывает, насколько доступным может быть дизайн для широкой аудитории.

2025 год обещает стать вехой в развитии технологий, где ИИ займет центральное место во всех аспектах нашей жизни. Мы на пороге новой эры креативности и инноваций! 🌟

Хотите оставаться в курсе новостей нейронных сетей? Подписывайтесь и делитесь своими мыслями в комментариях! 📲

Neural Networks | Нейронные сети

27 Dec, 06:00


🎯 Рекомендательные системы от Сбера: RePlay - ваш инновационный проводник в мире рекомендаций! 📈

RePlay — это мощный фреймворк, разработанный специально для создания и оценки рекомендательных систем. Он предоставляет полный набор инструментов для каждого этапа разработки рекоммендационной системы:

🚀 Ключевые возможности:
- Предобработка и разделение данных: обеспечивает оптимальную структуру и формат данных для эффективной обработки.
- Широкий выбор моделей: поддержка как современных, так и стандартных моделей для построения и оценки рекомендаций.
- Оптимизация гиперпараметров: упрощает процесс настройки параметров модели для достижения наилучшей производительности.
- Метрики оценки: включает разнообразные метрики для оценки точности и эффективности рекомендаций.
- Ансамблирование и гибридизация: поддержка объединения прогнозов от различных моделей для улучшения качества рекомендаций.
- Переход от оффлайн к онлайн: легкое переключение между экспериментами и производственными средами, обеспечивая масштабируемость.

💻 Совместимость:
- Поддержка аппаратного обеспечения: совместим с CPU, GPU и Multi-GPU конфигурациями.
- Интеграция с кластерными вычислениями: поддержка PySpark для масштабирования и обработки больших объёмов данных.

Примеры использования:
- Получите базовые знания с 01_replay_basics.ipynb.
- Сравните модели на датасете MovieLens-1M с 02_models_comparison.ipynb.
- Узнайте про предобработку и использование LightFM с 03_features_preprocessing_and_lightFM.ipynb.
- Примените сплиттеры данных с 04_splitters.ipynb.
- Создайте рекомендации для продуктовых категорий с 08_recommending_for_categories.ipynb.

Видео и статьи также помогут углубить ваше понимание возможностей RePlay!

🌟 Заинтересованы в создании своей рекомендательной системы? Пробуйте с RePlay на GitHub и отметьте проект звёздочкой.💚

Neural Networks | Нейронные сети

25 Dec, 06:00


🎬 Новая эра выразительных портретов с EMO! 🎭

Представляем вам EMO: Emote Portrait Alive — инновационную технологию для создания выразительных портретных видео с использованием аудиовизуальной диффузии. 🎥

🔗 Узнать больше:
- Проект EMO
- Подробности в статье

🔍 Почему EMO так важен?
Традиционные методы создания видео часто не улавливают тонкости человеческих эмоций и уникальные черты лиц. EMO решает эту проблему с помощью прямого преобразования аудио в видео, что исключает необходимость в 3D моделях и маркерах. Это позволяет добиваться невероятно реалистичных и выразительных анимаций, обеспечивая сохранение идентичности персонажа и плавность переходов.

🛠️ Как это работает?
1. Кодирование кадров: ReferenceNet извлекает ключевые особенности из изображения и кадров движения.
2. Диффузионный процесс: Аудиоэнкодер обрабатывает аудиоданные, слияя их с многофреймовым шумом для генерации изображения лица.
3. Денойзинг с вниманием: Backbone сеть использует внимание к референции и аудио для сохранения идентичности и управления движением.
4. Модуль времени: Регулирует временные аспекты и скорость движения, чтобы добиться естественного эффекта.

EMO позволяет создавать не только говорящие, но и поющие видео в различных стилях, задавая новые стандарты реализма и выразительности. Попробуйте и вы погрузиться в этот удивительный мир аудиовизуального искусства с EMO! 🎶😍

Neural Networks | Нейронные сети

23 Dec, 06:01


OpenAI вновь на гребне волны с анонсом своих последних разработок — O3 и O3-mini!
Ждём открытой версии в конце января 2025 года и полной версии O3 в феврале 2025 года.

👥 Ведущие эксперты Sam Altman, Mark Chen, Hongyu Ren и специальный гость Greg Kamradt, президент фонда ARC Prize, представляют это революционное достижение в искусственном интеллекте. O3 может стать настоящим искусственным общим интеллектом (AGI).

🔍 Что нового в O3?

- Превосходит ожидания: O3 не только улучшает задачи, ранее недосягаемые для ИИ, но и может превосходить экспертов в таких областях, как программирование и наука.
- Компактность с мощью: O3-mini сочетает в себе преимущества mini-размера без ущерба в мощности и производительности.

🔐 Безопасность и тестирование: важный шаг на пути к безопасному будущему ИИ. OpenAI призывает всех к участию в тестировании безопасности новых моделей, чтобы гарантировать их надежность и безопасность использования.

📌 Полезные ссылки:
- Официальный сайт OpenAI: openai.com
- Заполните заявку на тестирование: https://openai.com/index/early-access-for-safety-testing/#how-to-apply

🎥 https://www.youtube.com/live/SKBG1sqdyIU?si=niXvy9f4b-r9dTUJ
🎥 https://youtu.be/MggbzUxFVVI?si=5_Y-K-3BTUHySUqN

Neural Networks | Нейронные сети

20 Dec, 06:00


🚀 Создание GPT на NumPy: от основ до генерации текста 🧠📊

Представьте, что вы можете создать собственную версию GPT всего в 60 строках кода с использованием NumPy. Погрузитесь в мир языковых моделей и узнайте, как именно работает GPT! 💻

🔗 Полезные статьи:
- Изучите оригинальное руководство: Jay K. Mody
- Интересные статьи на Хабре: Часть 1 и Часть 2

🔥 Основные этапы реализации:
1. Ввод:
- Токенизируйте строку, разделяя её на токены и сопоставляя токены с целочисленными значениями через словарь.
- Применяются методы вроде Byte-Pair Encoding для более сложной токенизации.

2. Вывод:
- Получайте вероятности следующего токена для предсказания.
- Используйте автоагрессию для генерации текста, добавляя токены обратно во ввод.

3. Сэмплирование:
- Внесите элемент случайности в генерацию через методы top-k, top-p и температурное регулирование.
- Эти методы позволят вам экспериментировать с творческими аспектами модели.

4. Обучение:
- Используйте градиентный спуск и перекрёстную энтропию для обучения модели в задачах языкового моделирования.

5. Промптинг и in-context learning:
- Модель GPT обучена выполнять задачи с использованием только контекста промпта, без дополнительных настроек.

Neural Networks | Нейронные сети

18 Dec, 06:00


🔍 Подходы к созданию промптов: от zero-shot до chain-of-thought 🤖

Изучаем различные стратегии для взаимодействия с нейросетями, чтобы добиться максимальной эффективности в генерации ответов! 📈

## Zero-shot подход
- Описание: Без примеров, полагаясь на обученные данные и навыки нейросети.
- Как это работает: Вы даёте straightforward запрос, и нейросеть отвечает, используя свои алгоритмы и контекст.
- Пример:
- Запрос: «Проведи анализ настроения текста: "Карбонара в этом ресторане была посредственной."»
- Ответ: «Настроение: негативное.».
- 📝 Упоминание: Популярные вступления, такие как «Фламинго — это…», помогут без уточнений.

## One-shot и few-shot подходы 🎯
- Описание: Использование одного или нескольких примеров для достижения сложных результатов.
- Когда полезно: Создание нового слова или работа в узкоспециализированной области.
- Пример:
- Определение: «Гакбакить» — прыгать от радости.
- Запрос: «Напиши свой пример с использованием этого слова.»
- Ответ: «Максим начал гакбакить по всей квартире от радости.»

## Chain-of-thought подход 🧠
- Описание: Подход, при котором нейросеть размышляет над заданием шаг за шагом.
- Как это работает: При помощи фразы «Давай подумаем над этим шаг за шагом» активируется цепочка мыслей.
- Применение: Полезно при решении сложных задач или сценариев.
- Пример задачи:
- Вопрос: «Сергей может ударить 25 раз за минуту. Бой длился 5 раундов по 3 минуты. Сколько ударов нанес Сергей?»
- Ответ: Пошаговая инструкция для вычислений.

Эти подходы помогают не только улучшить точность ответов, но и учат нейросеть мыслить последовательно и глубже анализировать запросы. Используйте их, чтобы раскрыть полный потенциал своих AI-проектов! 🌐💡

🔗 Основная статья здесь

Neural Networks | Нейронные сети

13 Dec, 06:00


​​🚀 Современный алготрейдинг с ChatGPT: как искусственный интеллект меняет трейдинг 🤖📈

Погружаемся в глубины алготрейдинга, исследуя роль ChatGPT в данной сфере. Перед вами множество возможностей для оптимизации и улучшения инвестиционных стратегий с помощью AI. 📊

🔍 Ключевые темы обсуждения:
- Новые решения для всех: Современные подходы делают алготрейдинг доступным не только для профессионалов, но и для широкой аудитории.
- Проблемы существующих решений: Время, деньги, посредники и котировки — основные препятствия на пути к эффективной торговле.
- Преимущества новых технологий: Экономьте время и средства, получая более точные котировки и избавившись от лишних посредников.
- Роль ИИ в трейдинге: Узнайте, как искусственный интеллект помогает оптимизировать торговые стратегии и автоматизировать процессы.
- Практическое использование ChatGPT: Используйте AI для точных и целенаправленных действий в разработке стратегий.
- Создание эффективных стратегий: От идеи до реализации — как с использованием AI можно создать мощные торговые алгоритмы.
- Смещения вероятности: Ключ к успеху в алготрейдинге — понимание и использование различных видов маркеров для построения алгоритмов.
- Тестирование на TradingView: Эффективное использование платформы для максимизации результатов.
- Анализ и автоматизация: Внедрение ChatGPT для автоматизации анализа результатов тестирования.
- Интеграция рыночных фаз: Правильное внедрение фаз рынка в ваши стратегии может существенно повлиять на результаты.
- Основы портфельной торговли: Как строить и управлять эффективными портфелями для достижения финансовых целей.

🌟 Откройте для себя, как AI и технологии могут сделать ваш трейдинг более успешным и доступным!

Neural Networks | Нейронные сети

11 Dec, 06:00


🎤 Создай свою AI-певицу: музыка и клипы с нуля! 🎶

В этом видео вы узнаете, как создать уникальную AI-модель для вокала, написать музыку, анимировать рендеры и собрать всё это в стильный музыкальный клип. 🎬

🎛 Инструменты для творчества:
- 🔧 Генератор промптов: AI Photo Sales
- 🎨 Рендеринг: Rendernet
- 🔄 AI-музыка: Flux
- 🎵 Музыкальная платформа: Suno
- 🖌 Анимация и визуализация: Kling

🎥 Стоковые видео для ваших проектов:
1. 📹 UnlimVideos: AppSumo
2. 💻 Canva: Canva

Откройте для себя возможности AI в создании музыки и видеоконтента! 🌟

Neural Networks | Нейронные сети

09 Dec, 18:45


Стимпанк-дирижабль и опасные викторианские девушки в короткометражном видео, созданном с помощью искусственного интеллекта - «Механические сумерки».
Стимпанк, который мы заслужили.
https://youtu.be/tqo0GBYHCVg?si=-wDF555eHC_hVpQf

Neural Networks | Нейронные сети

06 Dec, 06:00


​​🔧 Prefect.io: Airflow, адаптированный для ML! 🤖
Мощный оркестратор, который сделает ваш MLOps проект ещё проще и эффективнее. 🚀 Prefect сочетает в себе все преимущества, такие как планирование на основе Cron и повторные попытки, но при этом предлагает безсерверную инфраструктуру и облачный UI интерфейс. ☁️

💡 Почему Prefect?
- Есть условно бесплатный тариф.
- Удобный облачный UI.
- Простой переход на ML оркестрацию.
Подробнее о сравнении с Airflow: Prefect vs. Airflow.

👨‍💻 Ресурсы:
- GitHub репозиторий с более чем 17K звёздами: GitHub
- Изучите применение на практике: Case Study

🎥 Быстрое введение: Узнайте, как превратить ваш Python скрипт в конвейер данных за 4 минуты. Подключение к Prefect Cloud, создание потоков, добавление задач и планирование: Введение в оркестрацию.

Начните прямо сейчас, зарегистрировав бесплатный аккаунт: Prefect Cloud.

Neural Networks | Нейронные сети

04 Dec, 06:00


​​🚀 Новинка от Stability: Stable Diffusion 3.5 Medium! 🤖

🤩 Основные преимущества:
1. Компактность: Модель такого же размера, как SDXL, и подходит для 10 ГБ VRAM, а с оптимизациями — даже для 8 ГБ! Ознакомьтесь с уже оптимизированной версией здесь: Hugging Face.
2. Скорость: В 3–4 раза быстрее, чем Stable Diffusion 3.5 Large, при этом качество остается на высоте.

🎨 Другие плюсы:
- Лицензия: Настоящее открытие!
- Разрешение: Поддержка до 2 мегапикселей (1440x1440).
- Гибкость в обучении: Проста в настройке и поддерживает предсказуемую тренировку. Надеемся на улучшенные файнтюны для еще лучшего понимания промптов благодаря enhanced MMDiT-X!

🔍 Читайте больше: Comfy

🎯 Где попробовать:
- Попробуйте сами тут: Hugging Face Space
- Ознакомьтесь с моделью подробно: Модель на Hugging Face
- Academic: Архив
- Исходный код: GitHub

🔥 Для всех, кто ищет мощные технологии без H100! 👀 💡 Время протестировать!

Neural Networks | Нейронные сети

03 Dec, 06:04


Привет! ⚡️
Зовем вас на Научный семинар «AI-кодеки: технологии, перспективы, вызовы»

5 декабря в 📍МФТИ собираемся обсудить, как нейросети перевернули мир сжатия видео и изображений:
– Путь развития технологий от истоков до SOTA, диффузии, random access
– Разбираем реальные кейсы и вызовы.
– Ловим инсайты от лучших экспертов!

Подробности – в карточках

🗓Когда: 5 декабря, 18:00

Регистрация до 4 декабря 15:00 на TimePad
Ссылка на запись и трансляцию будет в нашем канале @mil_team_partners. Вопросы – там же

Neural Networks | Нейронные сети

29 Nov, 06:00


​​🎥 Исследуй мир видеогенерации с Mochi 1 от Genmo! 🚀 Это опенсорс-инструмент, который превращает ваши текстовые подсказки в видеоролики длительностью до 5 секунд с частотой 30 FPS и разрешением 480p. Фотореализм и чёткость движений делают каждый ролик настоящим произведением искусства. 📽

🌐 Как это работает?
🔹 Отличное понимание промптов
🔹 Высокая чёткость движений

🛠 На сайте можно зарегистрироваться и создавать до 2 видео в день. Не упустите шанс попробовать: Genmo.

🔗 Дополнительные ресурсы:
- GitHub: Исходный код
- Hugging Face: Модель

Погрузитесь в творчество и создайте уникальные видео вместе с Mochi 1! 🌟

Neural Networks | Нейронные сети

27 Nov, 06:00


🔎 Открой для себя мир промптов! 📚 Библиотека промптов для ChatGPT содержит сотни проверенных запросов для разных задач и профессий. 🚀

🌟 Что внутри?
🔹 Задания для домашнего обучения
🔹 Инструменты для маркетинга
🔹 Решения для разработки

⚡️ Библиотека постоянно обновляется, чтобы вы могли использовать самые свежие идеи и решения. Доступ ко всему этому богатству вы найдёте по ссылке - Нейрон.

💾 Сохраняйте и пользуйтесь на здоровье!

Neural Networks | Нейронные сети

23 Nov, 06:00


🤖 НейроСинтез: Погружаемся в мир ИИ!

🎯 Всё о нейросетях простыми словами
💡 Лайфхаки и секреты работы с искусственным интеллектом
🎨 Крутые фишки для творчества, бизнеса и повседневных задач
Только полезные и понятные инструкции без сложных терминов

🔥 Разбираем популярные нейросети и новинки AI-мира
🎁 Делимся готовыми промтами и проверенными настройками
🚀 Показываем, как автоматизировать рутину с помощью ИИ
💪 Учимся использовать нейросети на максимум

👉 Подписывайся - будет интересно и полезно! ⚡️

https://t.me/gptnovostii

Neural Networks | Нейронные сети

22 Nov, 06:00


🚀 Недавно вышло более мощное семейство моделей YandexGPT 4 🌟: улучшенное качество ответов, работа с длинным контекстом и пошаговое рассуждение. Подробнее читайте здесь: Habr.

🔍 Что нового?

- 📜 Длинный контекст: YandexGPT 4 Pro теперь обрабатывает до 32 тысяч токенов вместо прежних 8 тысяч. Это значит, что модель лучше разбирается в сложных запросах и может анализировать до 60 страниц текста!

- 🌐 Работа с внешними источниками: Снижение галлюцинаций в RAG-сценариях и повышение надежности ответов. В 67% случаев YandexGPT 4 Pro превосходит предыдущее поколение в RAG-задачах.

- 🎓 Эффективность обучения: Использование библиотеки YaFSDP от Яндекса помогает проводить эксперименты быстрее и качественнее, улучшая все стадии машинного обучения.

- 🧠 Скрытые рассуждения: Модели обучены пошагово анализировать задачи и выводить ключевые этапы решения. Это особенно полезно для математики и научных исследований, где требуется глубокий анализ.

- 🛠 Режим вызова функций: В ближайшее время планируем добавить возможность вызова функций для создания умных ассистентов с применением внешних инструментов и API. Разработчики смогут задавать параметры, а клиенты использователи сгенерированные функции. Полноценный запуск будет чуть позже, после тестирования.

Можно попробовать улучшенную функциональность в облаке! 🌥️

Neural Networks | Нейронные сети

20 Nov, 06:00


Новое открытие в сфере ИИ - это адаптивные модели Lora для проекта FLUX, доступные на платформе Hugging Face: ссылка на модели 🌐.

За полгода существования FLUX, сообществом было обучено и загружено более 7500 моделей. Несмотря на то, что часть из них может не оправдать ожиданий и содержать ненадлежащий контент, впечатляет сам объём работы и вклада сообщества 🤖.

Оцените разнообразие и примите участие в развитии этой области!

Neural Networks | Нейронные сети

18 Nov, 06:00


Вышла крутая нейронка для кодинга — Qwen2.5-Coder-32B-Instruct. Модель выложили в открытый доступ, её можно скачать и пользоваться бесплатно.

По многим параметрам она круче ChatGPT-4. Причина этому — масштабное обучение модели на 5,2 триллионах токенов, в то время как GPT-4o — лишь на сотнях миллиардов.

Забираем имбу — тут.

@techmedia

Neural Networks | Нейронные сети

17 Nov, 11:45


🌟 OpenCoder - модели для кодинга, cookbook обучения и датасеты.

OpenCoder - это открытое и воспроизводимое семейство LLM для программирования, включающее 1,5B и 8B базовые и instruct версии, поддерживающее английский и китайский языки.

Семейство моделей OpenCoder обучалось с нуля на 2,5 трлн. лексем, состоящих на 90 % из сырого кода и на 10 % из веб-данных, связанных с кодом, и прошло отладку на более чем 4,5 млн. высококачественных примеров SFT, в итоге достигнув производительности топовых LLM с похожей специализацией.

В открытый доступ опубликованы не только веса моделей и код для инференса, но и датасеты, полный цикл обработки данных, результаты экспериментальной абляции и подробные протоколы обучения.

OpenCoder тщательно протестирован с помощью исследований абляции на различных стратегиях очистки данных и процессах обучения, включая эксперименты по дедупликации на уровне файлов и репозиториев, что обеспечило семейству тщательную проверку производительности моделей.

OpenCoder достигает высокой производительности в различных бенчмарках, что ставит их в ряд SOTA-моделей с открытым исходным кодом для задач программирования.

▶️ Семейство моделей OpenCoder :

🟢OpenCoder-1.5B-Base, 4 тыс. токенов контекста;

🟢OpenCoder-8B-Base, 8 тыс. токенов контекста;

🟠OpenCoder-1.5B-Instruct, 4 тыс. токенов контекста;

🟠OpenCoder-8B-Instruct, 8 тыс. токенов контекста;

▶️ Датасеты:

🟢OpenCoder-SFT-Stage1, 4.21 млн. строк;

🟠OpenCoder-SFT-Stage2, 375 тыс.строк.


▶️ Пример инференса на HF Transformers:

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "infly/OpenCoder-8B-Instruct"
model = AutoModelForCausalLM.from_pretrained(model_name,
torch_dtype=torch.bfloat16,
device_map="auto",
trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

messages=[
{ 'role': 'user', 'content': "write a quick sort algorithm in python."}
]

inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")

outputs = model.generate(inputs, max_new_tokens=512, do_sample=False)

result = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)



🟡Страница проекта
🟡Набор моделей
🟡Arxiv
🟡Набор датасетов
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #LLM #OpenCoder #Datasets

Neural Networks | Нейронные сети

14 Nov, 10:56


🎬 Магия видео генерации теперь для всех: знакомьтесь с Klingai.com! 🚀

Раньше искусственный интеллект, который создавал потрясающие видеоролики, был доступен лишь избранным в Китае. Но времена меняются, и теперь каждый из нас может прикоснуться к этой магии благодаря Klingai.com! 🌐

Klingai.com — это суперсовременный генератор видео от топовых китайских разработчиков. 📹 Он позволяет создавать видео выдающегося качества, и всё это с помощью ИИ! 🤖 Да, у сервиса есть свои нюансы, но главное — теперь он открыт для всех желающих! 👐

Так что не упустите шанс проявить своё творчество! Начинать творить прямо сейчас проще простого! 🎨🔥

Заходите на Klingai.com и создавайте свои уникальные видеошедевры! 💡💥

Neural Networks | Нейронные сети

04 Nov, 18:25


Дубляж умер: завирусились видео с нейропереводом актёров на русский — голоса не отличить от настоящих, а губы пугающе точно попадают в речь.
Возможно, скоро мы увидим новую жизнь старых музыкальных клипов на всех языках мира.
#нейрозвук #нейровидео

Neural Networks | Нейронные сети

05 Aug, 06:00


​​🚀 Векторные базы данных: простым языком про устройство и принцип работы
https://habr.com/ru/companies/tochka/articles/809493/

⚙️ Проблема
Нужно находить объекты, похожие по характеристикам. Простой подход через поиск совпадений слишком примитивен и не учитывает контексты и синонимы.

👾 Решение в лоб
Сравнение текстов или данных по количеству совпадений недостаточно. Требуется более умный метод для глубокого понимания объектов.

💡 Машинное обучение и векторизация
Машинное обучение решает задачу путем представления объектов (слова, текста, изображения) в виде числовых векторов. Эти вектора помогают компьютерам "понимать" данные. Разные методы, такие как Bag of Words, TF-IDF или Word2Vec, помогают векторизировать объект.

🔥 Векторные базы данных (ВБД)
Векторные базы данных (ВБД) — это NoSQL решения для хранения, индексирования и поиска похожих векторов, обеспечивая:
- Рекомендательные системы (например, рекомендации товаров)
- Поисковые системы (поиск по смысловому содержанию текста)
- Анализ изображений и видео (поиск похожих картинок)

🔍 Как это работает:
1. Преобразование объекта в вектор с помощью векторизатора.
2. Сохранение вектора и метаданных на диск.

📥 Чтение данных
Когда приложение отправляет новый объект для рекомендации:
1. Векторизуем объект той же моделью, получая вектор той же размерности.
2. Ищем наиболее близкий вектор. Возможна предварительная фильтрация по метаданным (например, длина текста > n).
3. Для ускорения поиска используется индексация, замедляющая запись, но делающая чтение быстрее. Разные базы данных могут предлагать различные сортиры и алгоритмы индексации.

Некоторые ВБД поддерживают только хранение, индексацию и чтение, а другие предлагают готовые векторизаторы, избавляя от необходимости писать и обучать свои модели.

#ВБД #МашинноеОбучение #РекомендательныеСистемы #Векторизация #IT #БазыДанных

Neural Networks | Нейронные сети

05 Aug, 06:00


🚀 Векторные базы данных: простым языком про устройство и принцип работы

⚙️ Проблема
Нужно находить объекты, похожие по характеристикам. Простой подход через поиск совпадений слишком примитивен и не учитывает контексты и синонимы.

👾 Решение в лоб
Сравнение текстов или данных по количеству совпадений недостаточно. Требуется более умный метод для глубокого понимания объектов.

💡 Машинное обучение и векторизация
Машинное обучение решает задачу путем представления объектов (слова, текста, изображения) в виде числовых векторов. Эти вектора помогают компьютерам "понимать" данные. Разные методы, такие как Bag of Words, TF-IDF или Word2Vec, помогают векторизировать объект.

🔥 Векторные базы данных (ВБД)
Векторные базы данных (ВБД) — это NoSQL решения для хранения, индексирования и поиска похожих векторов, обеспечивая:
- Рекомендательные системы (например, рекомендации товаров)
- Поисковые системы (поиск по смысловому содержанию текста)
- Анализ изображений и видео (поиск похожих картинок)

🔍 Как это работает:
1. Преобразование объекта в вектор с помощью векторизатора.
2. Сохранение вектора и метаданных на диск.

📥 Чтение данных
Когда приложение отправляет новый объект для рекомендации:
1. Векторизуем объект той же моделью, получая вектор той же размерности.
2. Ищем наиболее близкий вектор. Возможна предварительная фильтрация по метаданным (например, длина текста > n).
3. Для ускорения поиска используется индексация, замедляющая запись, но делающая чтение быстрее. Разные базы данных могут предлагать различные сортиры и алгоритмы индексации.

Некоторые ВБД поддерживают только хранение, индексацию и чтение, а другие предлагают готовые векторизаторы, избавляя от необходимости писать и обучать свои модели.

#ВБД #МашинноеОбучение #РекомендательныеСистемы #Векторизация #IT #БазыДанных

Neural Networks | Нейронные сети

03 Aug, 06:00


​​🔬⚡️ Test-Time Training RNN (ТТТ) - новый прорыв в машинном обучении! 🚀

Self-attention справляется с длинным контекстом, но имеет квадратичную сложность. Существующие слои RNN линейно сложны, но ограничены способностью скрытых состояний. Мы предлагаем новый класс слоев моделирования последовательностей с линейной сложностью и выразительными скрытыми состояниями.

💡 Главная идея: сделать скрытое состояние моделью машинного обучения и обновлять его путем самообучения даже на тестовых последовательностях. Наши слои называются Test-Time Training (TTT), и мы предлагаем две реализации: TTT-Linear и TTT-MLP.

👥 Исследования показывают, что TTT-Linear и TTT-MLP превосходят существующие модели. Они эффективно используют длинный контекст и показывают значительную производительность по сравнению с Transformer и Mamba.

📊 TTT-Linear уже быстрее Transformer при контексте 8k и сопоставим с Mamba по времени выполнения. TTT-MLP ориентирован на дальнейшие исследования и решает проблемы с памятью ввода-вывода, открывая новые горизонты для будущих исследований.

Для подробностей и доступа к статье посетите arXiv:
🟡Arxiv

🔗 Код доступен в JAX и PyTorch.
🖥 GitHub for Pytorch Stars: 277 | Issues: 3 | Forks: 12
🖥 GitHub for Jax [ Stars: 129 | Issues: 1 | Forks: 6 ]

Не пропустите этот инновационный шаг в машинном обучении! 🚀

#MachineLearning #RNN #AI #Research #Innovation

Neural Networks | Нейронные сети

01 Aug, 06:00


[Трансформер] на пальцах (буквально) ✍️📺
5-минутный видеоурок


Короткое видео, чтобы объяснить устройство "Трансформеров".

За 5 минут демонстрируется основная математика Трансформеров, с помощью ручки и бумаги!

@machinelearning_ru

Neural Networks | Нейронные сети

30 Jul, 06:00


Погружаемся в мир AI-творчества! 🌍🤖

Смотрите, как ИИ представляет путешествия. Несколько уникальных фото для вашего вдохновения!
https://telegra.ph/Pogruzhaemsya-v-mir-AI-tvorchestva-07-11

#AIарт #путешествия

Neural Networks | Нейронные сети

29 Jul, 06:00


​​Факт-чекинг для LLM: Может ли дообучение на новых данных вызвать галлюцинации?

📚 Основные моменты:
- Дообучение больших языковых моделей (LLM) на новых фактических данных может привести к генерации фактически неверных ответов, известных как галлюцинации.
- Контролируемые исследования в задачах вопросов и ответов (QA) показывают, что LLM сложно быстро усваивать новую информацию через дообучение.
- Примеры новых данных усваиваются значительно медленнее, чем те, которые соответствуют уже известным модели знаниям.

🔍 Результаты:
- По мере постепенного усвоения новой информации через дообучение, склонность LLM к галлюцинациям линейно возрастает.
- Лучшие результаты достигаются, когда модель усваивает большинство известных примеров, но только несколько новых.
- Введение слишком большого количества новой информации во время дообучения может снизить общую точность модели.

⚠️ Выводы:
- Необходимо тщательно балансировать количество новых данных при дообучении, чтобы предотвратить галлюцинации.
- LLM в основном приобретают фактические знания через предобучение, а дообучение оптимизирует использование этих знаний.

🤖 Детали исследования:
- Исследование включает смесь известных и новых примеров во время дообучения.
- Точная категоризация примеров на известные и новые с помощью структуры SliCK помогает оценить поведение модели при обучении.

#LLM #МашинноеОбучение #AIResearch #Дообучение #Галлюцинации

🔗 Читать полную статью

Neural Networks | Нейронные сети

26 Jul, 06:00


🚀 julius.ai | Новая степень автоматизации EDA!

Условно бесплатная нейронка на видео демонстрирует потрясающие возможности: обрабатывает таблицу с 6,5K (!) кандидатами с HeadHunter, фильтрует неразработчиков и создает группированные столбчатые диаграммы по грейдам (Junior, Middle, Senior) и языкам (Go, PHP, Python и др.).

👉 Хотите увидеть это в действии?
https://www.youtube.com/@Julius-AI
#llm #gpt

Neural Networks | Нейронные сети

24 Jul, 06:00


🚀 Языки программирования для Machine Learning: что выбрать? 🤖

Machine Learning (ML) стремительно преобразует множество сфер нашей жизни. Но какой язык программирования выбрать, чтобы максимально эффективно работать в этой области? Давайте рассмотрим наиболее популярные варианты.

1. Python 🐍

Пожалуй, самый популярный язык для ML благодаря огромному количеству библиотек и фреймворков:
- TensorFlow, Keras, PyTorch: для создания и обучения моделей.
- Pandas, NumPy, Scikit-learn: для работы с данными и их предварительной обработки.

🔹 Почему Python? Прост в изучении, множество открытых ресурсов и сообществ.

2. R 📊

Специализирован для статистики и визуализации данных. Отлично подходит для исследователей и аналитиков:
- Caret, randomForest: для создания моделей.
- ggplot2, Shiny: для визуализации и разработки интерактивных приложений.

🔹 Почему R? Идеален для анализа данных и построения моделей с мощными инструментами визуализации.

3. Java

Широко используется в корпоративных решениях и обладает высокой производительностью:
- Weka, Deeplearning4j: библиотеки для ML.
- Apache Spark MLlib: распределенные вычисления для анализа данных.

🔹 Почему Java? Отличается стабильностью, масштабируемостью и хорош для больших корпоративных проектов.

4. C++ 💻

Изначально используется для проектов, требующих высокой производительности:
- CNTK: фреймворк для обучения глубоких нейронных сетей от Microsoft.
- FastAI: интерфейс к PyTorch для быстрого построения ML-моделей.

🔹 Почему C++? Высокая скорость выполнения и контроль над ресурсами.

5. Julia 📈

Относительно новый язык, который набирает популярность в ML благодаря своей скорости и простоте:
- Flux.jl, MLJ.jl: фреймворки для Machine Learning.
- DataFrames.jl: работа с данными.

🔹 Почему Julia? Высокая производительность и простота синтаксиса, удобство для научных вычислений.

А каким языком программирования пользуетесь вы для проектов в ML? Делитесь в комментариях!👇

#MachineLearning #Python #R #Java #C++ #Julia #DataScience #AI #Programming

Neural Networks | Нейронные сети

23 Jul, 06:00


🚀 Новая IDE на Rust: Zed теперь доступен для Linux! 🐧

Zed — это мощная среда IDE, разработанная авторами Atom и Tree-sitter, и распространяемая по лицензии GPL. Основываясь на языке Rust, Zed предлагает пользователям:

🔹 Поддержка множества языков
🔹 Подсветка синтаксиса
🔹 Автоматическое выравнивание кода
🔹 Просмотр структуры кода
🔹 Автодополнение
🔹 Инструменты для совместной работы в реальном времени
🔹 Встроенный терминал
🔹 Режим Vim
🔹 Темы оформления

🔍 Уникальные функции Zed:

1. GPU-ускорение с Vulkan: Быстрая загрузка, мгновенное открытие больших файлов и низкая задержка ввода.
2. Интеграция с ChatGPT от OpenAI: Генерация кода, рефакторинг и устранение проблем с помощью ИИ.
3. Ненавязчивая ИИ-интеграция: Взаимодействие с ИИ в отдельной панели, не мешая основной работе.

✒️ Zed — отличный инструмент как для опытных разработчиков, так и для тех, кто только начинает свой путь в программировании. Однако, несмотря на удобства, помните, что ИИ не заменит человеческую изобретательность — GPT предлагает лишь решения, основанные на уже известных данных.

🔗 Подробнее и скачать: https://zed.dev/

#ZedIDE #Rust #Linux #Programming #OpenSource #IDE #ChatGPT

Neural Networks | Нейронные сети

22 Jul, 06:00


​​CyberYozh выпускает новую партию бесплатных курсов про анонимность

Материал, как обычно, ходит по краю, но точно стоит вашего внимания. Вот список новинок:

😎 Proxy для Анонимности — громко заявляя, что сервисы и самодельные VPN — это дыра в вашей анонимности, ребята покажут и расскажут альтернативные варианты, как повысить приватность с помощью цепочек из Proxy, Tor и Whonix в разных комбинациях.

🔒 Компьютерная криминалистика (форензика) — курс, в котором вы узнаете, как можно получить удаленные файлы с защищённых или уничтоженных устройств и носителей.

😉 Шпионские устройства — расскажут про вооружение современных охотников за ублюдками. Дроны, глушилки и другие увлекательные девайсы нацеленные на слежку за целью.

Доступ откроют уже *24 июля*, одновременно с бесплатным онлайн-ивентом, где будут выступать хакеры, детективы и бывшие киберпреступники. Веселые ребята…

Neural Networks | Нейронные сети

19 Jul, 06:00


AI Image to Video Free Generator

📹 Бесплатный генератор AI видео из изображений
Ищете способ преобразовать ваши изображения в потрясающие видео? Попробуйте этот бесплатный генератор! 🚀
Просто загрузите свои фото, и ИИ создаст из них увлекательное видеоповествование. Идеально подходит для соцсетей, презентаций и личных проектов. 🎬
Попробуйте сейчас и откройте для себя новые возможности визуального творчества! 🌟

🔥https://creatus.ai/image-animation-image-to-video

#AI #Видеогенератор #ИскусственныйИнтеллект #Технологии

Neural Networks | Нейронные сети

17 Jul, 06:00


Сравнение генераций Sora от OpenAI и китайского Kling.
https://youtu.be/zA6eq_RMeik?si=VpEVKUN-wdNSSOfu

Sora: https://openai.com/index/sora/
Kling: https://kling.run/

Neural Networks | Нейронные сети

17 Jul, 06:00


Сравнение генераций sora от OpenAI и китайского kling. Местами kling вообще не уступает sora, как по мне.

1)Видео от первого лица, на котором муравей перемещается по муравейнику.

2)Исторические кадры Калифорнии во время золотой лихорадки.

3)Молодой человек сидит на облаке в небе и читает книгу

4)В анимационной сцене крупным планом показан невысокий пушистый монстр, стоящий на коленях рядом с тающей красной свечой.

5)Фотореалистичное видео крупным планом, на котором два пиратских корабля сражаются друг с другом, плавая в чашке кофе

6)Бело-оранжевый полосатый бродячий кот мечется по переулку под проливным дождем в поисках убежища.

7)Гамбургер

Neural Networks | Нейронные сети

15 Jul, 06:00


Новая модель Claude 3.5 Sonnet которая в некоторых моментах лучше GPT4o — можете бесплатно играть с ней тут https://www.anthropic.com/

Neural Networks | Нейронные сети

12 Jul, 06:00


​​Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Image Synthesis.

Kolors — это масштабная модель генерации изображений из текста на основе латентной диффузии, разработанная командой Kuaishou Kolors. Обученная на миллиардах пар текст-изображение, Kolors демонстрирует значительные преимущества по качеству визуализации, точности сложных семантических конструкций и рендерингу текста как для китайских, так и для английских символов.

Сама модель тут:
https://huggingface.co/spaces/gokaygokay/Kolors

Читаем тут:
https://huggingface.co/Kwai-Kolors/Kolors

Код:
https://github.com/Kwai-Kolors/Kolors

Галерея:
https://kolors.kuaishou.com/

Нода для Комфи:
https://github.com/kijai/ComfyUI-KwaiKolorsWrapper

Дока:
https://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf

Neural Networks | Нейронные сети

11 Jul, 06:01


Meet Figma AI: Empowering designers with intelligent tools.
https://www.figma.com/blog/introducing-figma-ai/