Нейронавт | Нейросети в творчестве @greenneuralrobots Channel on Telegram

Нейронавт | Нейросети в творчестве

14 Feb, 14:44

Animate Anyone 2: High-Fidelity Character Image Animation with Environment Affordance

Второе поколение нейронки от Tongyi Lab и Alibaba Group. Кода к первому так и нет.

Заменяет персонажа на видео по одному фото.

Кода нет и не стоит губу раскатывать

#image2video #humananimation #characteranimation #pose2video

331

Нейронавт | Нейросети в творчестве

14 Feb, 10:40

Валентинки через Glif

Теперь каждый глиф стоит по-разному, но на старте вам дают 30 кредитов бесплатно и так же они ежедневно пополняются. А я подготовил для вас Глифы для Валентинок!

💰 В среднем 1 генерация в моих глифах тратит ~8 кредитов
💰 Оригинальный Glif — ~5 кредитов

Готовые глифы для Валентинок:
► Оригинальный Glif — откуда я взял идею, генерирует картинку + милый текст через Sonnet. Из минусов — вотермарка.

► Мой вариант. 2:3 размерность (1200x1600px) — Идеален для печати!
НО! Есть особенность сделал его с разделением промпта для Clip L и T5XXL.
Мне помогает вот этот промпт для любой LLM: Create prompts based on text for Clip L and T5XXL. Text: [Ваше описание или картинка]
Если не хочется заморачиваться с промптами для Clip L и T5XXL, просто вставьте одинаковый текст в оба поля.

► Вариант с возможностью референс картинки. Добавил Redux туда.

► HF Lora — для тех кто хочет локально погенерить

— Я распечатал эти открытки на акварельной бумаге, и они выглядят как настоящая пастель!

516

Нейронавт | Нейросети в творчестве

13 Feb, 13:17

Этот ролик, сделанный в Veo 2 - редчайший случай из всего потока генеративного видео, когда я верю что это люди в кадре, а не бестолковая кучка пикселей, мимикрирующих под людей. Они делают что-то осмысленное, а не имтируют движение. По крайней мере, мне это так выглядит

Ну и тут посмотреть бы на промпты и количество отбракованных версий. Скорее всего автор режиссер с опытом и понимает как работает камера и действие в кадре

940

Нейронавт | Нейросети в творчестве

13 Feb, 13:17

Если честно, то даже я приподохренел.

Тут у нас была дискуссия (бессодержательная по большей части) за рекламу, ну штош, держите рекламы.
Давайте вы сначала посмотрите ролик со звуком(!), а потом почитаете тексты ниже...

Пришлось смотреть 3 раза.

Конечно, я испортил весь эффект, тем что сразу акцентировал внимание на ролике. Но таки да, это генератив от Veo2. И тут Гугл, похоже, пока непобиваем.
Я вначале подумал, что дядьки с камерами настоящие и щас нам расскажут про совмещение ИИ и видео.

Но из настоящего тут только говорящая голова со странным акцентом в части behind the scenes

Пруф тут: https://www.youtube.com/watch?v=VqLWWYfCEbI

Нормальный такой 𝘢𝘯 𝘪𝘯𝘥𝘦𝘱𝘦𝘯𝘥𝘦𝘯𝘵 𝘤𝘳𝘦𝘢𝘵𝘪𝘷𝘦 𝘦𝘹𝘦𝘳𝘤𝘪𝘴𝘦 - как пишет автор. Один. Без ансамбля.

От себя добавлю, что закадровый нарратив для ИИ-роликов - это прям палочка выручалочка, недавно об этом думал.

Встречал немного снобистское мнение в прошлой жизни, что закадровый нарратив появляется там, где режиссер не может справиться со сценой или сценарием. Для ИИ - это идеальные костыли. Поглядите ролик еще раз.
И спать.

P.S. Огромное спасибо Всеволоду Тарану за такой шикарный ИИ-подгон.

@cgevent

539

Нейронавт | Нейросети в творчестве

13 Feb, 07:57

Pippo : High-Resolution Multi-View Humans from a Single Image

Из одного портретного или в полный рост фото человека делает тёрнтейбл - фото облет студийного качества 512х512 (называют это 1K)

Код

#image2video #novelview

1,182

Нейронавт | Нейросети в творчестве

12 Feb, 14:09

Convergence

Лондонский стартап хвастается браузерным агентом, побивающим 200-долларовый Operator (или он уже бесплатный?)

На бесплатном тарифе 5 сессий в день и одна автоматизация

#assistant #agent

1,260

Нейронавт | Нейросети в творчестве

12 Feb, 13:49

InspireMusic: A Unified Framework for Controlled Music, Song, Audio Generation with Collaborative Semantic and Acoustic Tokens

Опенсорсный генератор музыки от Tongyi Lab и Alibaba Group

Умеет создавать музыку по тексту, продолжать музыку, реконструировать (непонятно)

Качеством звука пока не впечатлил, но это опенсорс, тут есть перспектива

Код
Демо

#text2music #music2music #music

1,120

Нейронавт | Нейросети в творчестве

12 Feb, 13:18

CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers

Видеогенератор с персонализацией, создает видео с объектом, заданным картинкой

За основу берут CogVideoX-5B и прикручивают лору

Код ждем

#personalization #text2video

994

Нейронавт | Нейросети в творчестве

10 Feb, 12:03

VPN, который не тормозит ваш AI-поток 🤖💨

Нейросети растут, интернет поджимает. А если без шуток — стабильный и быстрый доступ к нужным сервисам решает многое.

🌍 Сервера в Финляндии, США и Японии — минимальная задержка, высокая скорость.
🔀 Маршрутизация ⚡️ — бесшовный доступ к банкингу и российским сервисам.
🤖 Подключение в два клика — Telegram-бот выдаст vless-ключ за пару секунд.
💼 Гибкость для бизнеса — кастомные сервера под задачи команд.

Код, модели, генерим, тестим — без тормозов и ограничений. 🚀

👉 Залетай и работай без преград!

#промо

362

Нейронавт | Нейросети в творчестве

10 Feb, 09:12

#humor

634

Нейронавт | Нейросети в творчестве

10 Feb, 06:30

Goku: Flow Based Video Generative Foundation Models

Новый генератор видео и картинок от ByteDance

И на основе Goku они еще сделали Goku+ - семейство моделей для оптимизации рекламных сценариев с участием людей и продуктов

гитхаб (кода нет)

#text2video #image2video #text2image

724

Нейронавт | Нейросети в творчестве

10 Feb, 05:39

GSTAR: Gaussian Surface Tracking and Reconstruction

Реконструкция динамичных 3D сцен на гауссианах по видео, с фотореалистичным рендером и 3D-трекином

GSTAR адаптируется к изменениям топологии с помощью двух механизмов: последовательного отслеживания стабильных поверхностей (красные кружочки) и динамической генерации поверхности для вновь появляющейся геометрии (оранжевые кружочки).

Код ждем

#video2scene #video2gaussian #videoto3d #videoto4D #video2mesh #gaussian

758

Нейронавт | Нейросети в творчестве

10 Feb, 05:08

3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation

Контроль траектории движения нескольких объектов при генерации видео по тексту.

6 степеней свободы на каждый контролируемый объект

Код прикручен к CogVideoX-5B

Код

#trajectory #motioncontrol

785

Нейронавт | Нейросети в творчестве

09 Feb, 15:46

AEExplorer

В AfterEffects завезли сторонний ИИ-ассистент.
Он даже умеет сам какой-то моушен создавать по промпту.

Прикрутят ли Adobe своего ассистента, увеличит ли это стоимость подписки? Ау Adobe?

#plugin #assistent #agent

1,189

Нейронавт | Нейросети в творчестве

08 Feb, 15:15

Krea Chat

Krea выпустили в открытую бету ассистента для генерации/редактирования видео и изображений текстовыми указаниями.

Он еще вас и проконсультирует что да как.

За понимание указаний отвечает DeepSeek

У меня не получилось зайти 🙁

Подписчики говорят, бесплатно только первые три запроса

#imageediting #assistant

1,330

Нейронавт | Нейросети в творчестве

08 Feb, 08:09

Объявляю субботний сброс мемов

#humor

1,312

Нейронавт | Нейросети в творчестве

07 Feb, 16:46

Tülu 3 405B

А вот уже кто по циферкам обскакал DeepSeek-V3 в опенсорсе.

Дообученная версия Llama3 на 405B параметров от Allen AI

Попробовать

#assistant

1,478

Нейронавт | Нейросети в творчестве

05 Feb, 16:11

DeepSeek-VL2-small

DeepSeek решил заспамить нас моделями

DeepSeek-VL2-small - средняя визуально-языковая модель на 2.8B параметров из семейства DeepSeek-VL2, наследника DeepSeek-VL

Построена на базе DeepSeekMoE-16B

Демо

#VLM #assistant #image2text

709

Нейронавт | Нейросети в творчестве

05 Feb, 15:19

Replit: Idea to app, fast

Отличный заход от replit, который когда-то просто был для меня сайтом для упражнений на питоне.

Предлагают юзерам смартфонов без опыта в программировании создавать приложения по текстовому запросу

AppStore
GooglePlay

#iOS #coding #assistant #android

765

Нейронавт | Нейросети в творчестве

05 Feb, 14:49

LightDiffusion-Next

Новая оболочка для диффузных генераторов картинок, хвастается тем что на 30% быстрее ComfyUI

Функционал пока скупой
Ладно, запомним на будущее

Гитхаб
Демо
Обсуждение на реддит

#text2image #tools #gui

759

Нейронавт | Нейросети в творчестве

05 Feb, 14:25

Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation

Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке

Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий

Демо
Код
Колаб ноутбуки

#text2audio #tta #audio2audio #audioinpainting

792

Нейронавт | Нейросети в творчестве

05 Feb, 13:48

Diffusion-Eraser

Инпейнтинг на gradio
Никаких настроек, только выделение области кистью
Что под капотом непонятно
Попробовал - рисует фигню
Ну пусть будет на всякий случай

#inpainting

795

Нейронавт | Нейросети в творчестве

05 Feb, 13:13

Сравнение опенсорсных видеогенераторов от подписчика Mr. D

Сделано запросом к DeepResearch

высокие цифры = лучшие для пользователя

Hunyuan на диаграмме: 🤘

#comparison

814

Нейронавт | Нейросети в творчестве

05 Feb, 12:49

BEN2: Background Erase Network

Удаление фона с изображений и видео
Ест 3.5 ГБ VRAM, скорость 3fps на RTX3090
Демоспейс выдает RGB mp4 с зеленкой, естественно без альфы

Демо
Код
Веса
Попробовать на офсайте

#bg #bgremoval #image2matte #video2matte

890

Нейронавт | Нейросети в творчестве

05 Feb, 12:12

Dialog 1.0

Новая голосовая диалоговая модель от Play AI (aka PlayHT)
"Ультраэмоциональная"
Рилтайм, задержка 303 мс
30+ языков, русский есть
до 48КГц

Возможности:
- клонирование голоса
- ИИ подкасты из PDF, картинок, текстов
- голосовые агенты
- API
- рилтайм среда - диктор или диалог 2 голоса

Попробовать

#voicecloning #text2speech #tts #agent #podcast

906

Нейронавт | Нейросети в творчестве

05 Feb, 11:24

Leapfusion Hunyuan Image-to-Video V2

Обновка опенсорсного генератора видео по картинке, разрешение 544p

воркфлоу

#image2video #ComfyUI

1,171

Нейронавт | Нейросети в творчестве

04 Feb, 19:16

Срочные (нет) новости (нет)

Слышали про квадрат на Марсе?
Так вот, там целый датацентр уже построен и даже нанесен на гуглмапс с панорамами самим Гуглом 1 апреля 2017 года

#оффтоп #humor

1,331

Нейронавт | Нейросети в творчестве

04 Feb, 16:36

Qwen Video

Я писал про генерацию видео в Qwen2.5-1M, но она была недоступна. А на днях ее таки подключили видимо для всех

Если еще не пробовали, даю отмашку

#text2video #image2video

1,264

Нейронавт | Нейросети в творчестве

26 Jan, 22:17

Опубликован код редактора изображений FramePainter

Код

спасибо @Dmitriy_Ru6ts0v

#imageediting #sketch2image #image2image

694

Нейронавт | Нейросети в творчестве

25 Jan, 13:13

Мемы от ruDALL-E из 2022 года

Подрезал у @oulenspiegel_channel

#humor

1,163

Нейронавт | Нейросети в творчестве

25 Jan, 09:02

Пост обмема мемами

Не помню где взял это видео, включайте звук

[update] говорят, автор doopeedo

#humor

1,287

Нейронавт | Нейросети в творчестве

25 Jan, 06:09

DreamClear: High-Capacity Real-World Image Restoration with Privacy-Safe Dataset Curation

Реставратор фото от ByteDance и ряда соавторов

Под капотом помимо собственной модели целый зоопарк:

PixArt-α-1024
sd-vae-ft-ema
T5 Text Encoder: t5-v1_1-xxl
LLaVA
SwinIR

Код

#imagerestoration #facerestoration #upscale #deblur

1,183

Нейронавт | Нейросети в творчестве

24 Jan, 17:26

Krea.ai real-time custom AI models

Krea открыли возможность тренировать свои рилтаймовые лоры. Не флюс, а, очевидно, sdxl

И теперь, оплатив тренировку, можно онлайн рисовать по наброскам своими лорами

#lora #training #finetuning #realtime

1,783

Нейронавт | Нейросети в творчестве

22 Jan, 14:26

DiffuEraser: A Diffusion Model for Video Inpainting

Слишком долго у Propainter не было конкурентов в опенсорсе.

Это инпейнтинг видео по маске. И на черрипиках он заметно лучше пропейнтера

Потребление видеопамяти - на скрине

Код
Демо

#videoinpainting #inpainting

734

Нейронавт | Нейросети в творчестве

22 Jan, 13:10

Опубликован код релайтера Neural Gaffer

Код

#relighting

783

Нейронавт | Нейросети в творчестве

22 Jan, 12:18

Mobile-Agent-E

Агент для мобилки от Alibaba

Код
Демо

#agent #mobile

719

Нейронавт | Нейросети в творчестве

22 Jan, 11:44

Gemini 2.0 Flash Thinking

Гугл обновил свою рассуждалку. Контекст 1 миллион токенов - впятеро больше, чем o1 Pro

В топе на арене

Уже в AnyChat

Попробовать (не для российских IP)

#reasining #assistant

775

Нейронавт | Нейросети в творчестве

22 Jan, 11:14

Go with the Flow

Контроль движения на генерации видео за счет геометрического искажения шума

Код
Веса
Видео (4 минуты)
Видео туториал

#motioncontrol #motiontransfer #cameracontrol

760

Нейронавт | Нейросети в творчестве

22 Jan, 10:13

UI-TARS

Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance

В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.

умеет находить информацию, выполнять действия в приложениях и веб-сайтах

UI-TARS Desktop

#agent #gui #vlm

790

Нейронавт | Нейросети в творчестве

22 Jan, 09:42

Hunyuan3D-2GP: 3D Generation for the GPU Poor

Это Hunyuan3D-2 для бедных. Генерация за одну минуту на 6ГБ VRAM

#textto3d #imageto3d

804

Нейронавт | Нейросети в творчестве

22 Jan, 09:12

audio input

В Suno v4 появилась функция превращающая ваш голос в трек

#voice2music #audio2music

886

Нейронавт | Нейросети в творчестве

22 Jan, 08:43

Video Depth Anything: Consistent Depth Estimation for Super-Long Videos

Генератор консистентной глубины для длинных видео. На черрипиках бьет конкурентов, в том числе DepthCrafter.

Код
Демо

#video2depth

992

Нейронавт | Нейросети в творчестве

20 Jan, 09:12

GaussianAvatar-Editor: Photorealistic Animatable Gaussian Head Avatar Editor

Редактор аватара головы на гауссианах

Код ждем

#humanavatar #gaussian #gaussianeditor

140

Нейронавт | Нейросети в творчестве

20 Jan, 08:49

Flex.1-alpha

Модификация #Flux от Ostris. Старое название - OpenFLUX

Основная фича - должен легко поддаваться дообучению.

Архитектура FLUX.1-dev с небольшими отличиями. Но в основе FLUX.1-schnell, а значит сохранена лицензия последнего.

Не требует CFG для генерации изображений

Будет работать из коробки с большинством GUI

#finetuning #text2image

311

Нейронавт | Нейросети в творчестве

20 Jan, 08:26

Тренировка Lora FastHunyuan на 16ГБ VRAM

удалась реддитору, подробности по ссылке

#lora #finetuning

424

Нейронавт | Нейросети в творчестве

19 Jan, 19:33

Пока еще идет тестирование новой Pika, накидайте промптов, погенерю. Показывать пока нельзя, но когда будет можно - покажу что получилось.

Только готовые промпты пожалуйста, расписывать ваши идеи не буду

919

Нейронавт | Нейросети в творчестве

19 Jan, 13:27

Свершилось.
Это не просто нейровидео на уровне прошлого года. Это клип из сериала который сейчас форсят онлайн кинотеатры.

Название не скажу. А если вы уже знаете - мои соболезнования, ибо сам серик ужасен.

Но сам факт что нейровидео уже в кино 🤯

Автору нейровидео респект, милости просим поделиться что да как.

PS. Для тех кто в танке. Не считаю что это видео представляет какую-то художественную ценность. Пост про то, что нейровидео уже в кино

#news

1,256

Нейронавт | Нейросети в творчестве

19 Jan, 10:37

Paul Schrader, сценарист фильмов «Таксист» и «Бешеный бык» (за режиссёрством Martin «🖐😶🤚» Scorsese ), пишет в фейсбуке:

— Я только что осознал что AI умнее меня. У него лучше идеи, он предлагает более эффективные способы их осуществления. Это экзистенциальный момент, схожий с тем, как Kasparov чувствовал себя в 1997, когда понял, что DeepBlue обыграет его в шахматы
— (Что привело вас к этим мыслям?) Я спросил у ChatGPT идеи сценариев от Paul Schrader. Оно выдало результаты лучше, чем мои собственные идеи.

====

— Я только что отправил ChatGPT сценарий, написанный мной несколько лет назад, и спросил об улучшениях. Через 5 секунд я получил ответ с заметками на уровне или даже лучше, чем я получал от кинопродюсеров.

====

Фух, ну хорошо, что тут можно отмазаться, мол, сценарист слабенький, лишь номинировался на Оскар, а не выигрывал его, и что ему 78 лет, и он уже ничего не понимает 😀

747

Нейронавт | Нейросети в творчестве

18 Jan, 13:34

В Чикаго разработали роборуку, управляемую силой мысли.

А вы, джентльмены, к чему бы ее приспособили?

#news #robots

1,241

Нейронавт | Нейросети в творчестве

18 Jan, 12:05

Бегите проверять почту если подписаны на рассылку Pika

Раздают тестовый доступ к новой модели, завтра уже будет поздно. В письме будет ссылка на чат - кликаем, ждем одобрения модератора

Модель вероятно,публично покажут 20 января

Приглашение в Mago.Studio тоже ищите в почте, только там сначала анкета, потом отбор

#news #text2video #video2video

1,257

Нейронавт | Нейросети в творчестве

18 Jan, 10:38

CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation

Создает из картинки текстурированную 3D модель за полминуты (неизвестно на чем).

За текстуры отвечает SDXL

Код ждем

#imageto3d

1,283

Нейронавт | Нейросети в творчестве

18 Jan, 08:03

Субботняя проверка мемов. Есть че?

#humor

1,768

Нейронавт | Нейросети в творчестве

03 Jan, 15:19

Arnis: Generate any location from the real world in Minecraft

Подгон любителям Майнкрафта. Быстрое автоматическое воссоздание любого реального города в Майнкрафте

#tools #game #mapto3d

825

Нейронавт | Нейросети в творчестве

03 Jan, 14:47

Gaussian Frosting: Editable Complex Radiance Fields with Real-Time Rendering

Новый метод представления поверхностей с помощью сетки, покрытой слоем гауссиан разной толщины.

Этот слой, называемый "Frosting", позволяет захватывать как сложные объемные эффекты, создаваемые материалами вроде волос или травы, так и плоские поверхности. Модель создается только из RGB-изображений и может быть визуализирована в реальном времени, а также анимирована с использованием традиционных инструментов анимации

🍒Ну и вишенка: есть аддон для блендера

Код
Blender

#blender #gaussian #rendering #realtime

780

Нейронавт | Нейросети в творчестве

03 Jan, 14:18

MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision

Подгон от Microsoft. Преобразует изображение в меш через карту глубины.

На сравнении выглядит лучше конкурентов, в том числе Depth Anything 2

Код
Демо

#image2depth #video2depth #image2mesh #video2mesh

763

Нейронавт | Нейросети в творчестве

03 Jan, 13:48

SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Метод генерации видео одновременно с нескольких ракурсов. Демонстрационные видео сделаны в CogvideoX

Код

PS Акелла промахнулся. я про него уже писал

#text2video #multiview #cameracontrol

796

Нейронавт | Нейросети в творчестве

03 Jan, 13:17

ebook2audiobook v2.0.0 Beta

Конвертер электронных книг в аудиокниги обновился. Поддерживает разные форматы, клонирование голоса, 1124 языка, в том числе русский.

Но мне не понравилась голосовая модель, попозже покажу лучший вариант

Демо

#text2speech #ebook2audiobook #voicecloning

894

Нейронавт | Нейросети в творчестве

03 Jan, 12:48

PERSE: Personalized 3D Generative Avatars from A Single Portrait

По одному входному портрету PERSE создает анимируемый персонализированный 3D-аватар на гауссианах с независимым редактированием различных атрибутов лица

Код ждем

#humanavatar #portraitanimation #gaussian #facialanimation

815

Нейронавт | Нейросети в творчестве

03 Jan, 12:18

TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization

Генератор звуковых эффектов. Речь и музыку не вывозит, проверил.

Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды

Код
Демо

#text2audio #text2sfx #foley

808

Нейронавт | Нейросети в творчестве

03 Jan, 11:21

#humor

Какие-то безумцы релизят свои нейросети даже 1 января. Не дают спокойно посидеть без новостей. Так что выхожу из сумрака

866

Нейронавт | Нейросети в творчестве

31 Dec, 20:10

Петербурга вам в ленту

1,238

Нейронавт | Нейросети в творчестве

31 Dec, 15:28

Расскажите что у вас хорошего произошло в этом году?

1,388

Нейронавт | Нейросети в творчестве

31 Dec, 09:30

Новости сегодня уже бесполезно постить))

Этот год был определенно годом видеогенераторов и языковых моделей. Не согласны? Возразите мне в комментах))

Делайте ставки что бустанет в следующем году?

Спасибо всем кто помогал другу другу в комментах, спасибо за ваши репосты и реакции, вы лучшие❤. Поддержите канал бустами, своим ИИ-творчеством или чем хотите, велком а комментарии

Счастья вам, здоровья и быстрого инференса 🥂

1,372

Нейронавт | Нейросети в творчестве

30 Dec, 19:18

DepthLab: From Partial to Complete

инпейнт карт глубины на основе диффузионных моделей.

Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.

Код
Веса

#inpainting #image2depth

1,538

Нейронавт | Нейросети в творчестве

30 Dec, 18:58

1.58-bit FLUX

Bytedance и POSTECH квантизовали FLUX [dev].
Квантизованная модель требует для инференса в 5 раз меньше VRAM и занимает на диске в 7.7 раз меньше места.

К сожалению, есть только препринт, а ссылка из препринта ведет на несуществующий сайт. Ждем

#news #optimization #flux

495

Нейронавт | Нейросети в творчестве

30 Dec, 14:30

Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

Масштабируемый трансформер для быстрой генерации картинок от Yandex Research. Приятно под занавес года увидеть отечественный релиз.

По словам разработчиков, превосходит существующие авторегрессионные (AR) модели и тягается наравне с ведущими диффузными моделями по качеству, при этом обходя их в 7 раз по скорости.

Код
Демо 512
Демо 1024

#text2image

675

Нейронавт | Нейросети в творчестве

30 Dec, 11:08

Опубликован код генератора 3D сцен на гауссианах по картинке WonderWorld

Код

#gaussian #image2scene #imageto3d

815

Нейронавт | Нейросети в творчестве

30 Dec, 09:50

OCTAVE (Omni-Capable Text and Voice Engine)

Генератор речи следующего поколения от Hume AI.

Сочетает возможности EVI 2 с возможностями таких систем, как Voice Engine от OpenAI, TTS Voice Design от Elevenlab и NotebookLM от Google Deepmind

OCTAVE может генерировать любой голос и индивидуальность - и сопровождающий язык – по подсказке, имитируя пол, возраст, акцент, вокальный регистр, эмоциональную интонацию, стили речи.

Клонирует голос, акцент и индивидуальность любого говорящего из шумной записи продолжительностью всего в 5 секунд.

Общается голосом в реальном времени. Может создать несколько агентов, общающихся между собой, как в NotebookLM, только в реальном времени.

Сейчас идет тестирование "безопасности" модели кругом избранных, осторожничают

#realtime #text2speech #tts #voicecloning

844

Нейронавт | Нейросети в творчестве

30 Dec, 09:23

Animate AI

Генератор анимации с консистентными персонажами

записаться в вейтлист

#image2video #text2video #cartoon

840

Нейронавт | Нейросети в творчестве

28 Dec, 11:45

Aria-UI: Visual Grounding for GUI Instructions

Быстрый легковесный ИИ-агент для выполнения задач на устройстве пользователя через взаимодействие с пользовательским интерфейсом

Код
Демо

#assistant #agent

1,033

Нейронавт | Нейросети в творчестве

28 Dec, 11:00

GenWarp: Single Image to Novel Views with Semantic-Preserving Generative Warping

модель генерирует правдоподобные новые ракурсы по одному входному изображению.

Созданные новые ракурсы можно использовать для 3D-реконструкции. В приведенном на видео примере реконструкция 3D-сцены с помощью InstantSplat

Код
Демо

#novelview

1,522

Нейронавт | Нейросети в творчестве

28 Dec, 09:46

StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos

Модель для преобразования обычного видео в стерео 3D от Tencent

Может помните времена когда было модно выпускать кино в 3D. И чтобы не заморачиваться на съемках и основном посте, делали стереоконверсию фильма. На это нужны были армии ротоскоперов. А теперь эта задача становится намного дешевле

Код

#stereoconversion

985

Нейронавт | Нейросети в творчестве

27 Dec, 11:14

Whisk

новый картинкогенератор от Google Labs

Вместо текстовых промптов используем три картинки: одну для субъекта, вторую для сцены, третью для стиля.

Далее Gemini создаёт описания загруженных изображений и передаёт их в Imagen 3

Запаситесь американским IP адресом

#image2image #online

862

Нейронавт | Нейросети в творчестве

27 Dec, 09:48

DeepSeek V3

Крупнейшая модель в опенсорсе, конкурирует с Sonnet 3.5 и GPT-4o. Превосходит Llama 405B. Особенно хорош в кодинге и математике.

Архитектурно - совет экспертов, рассуждающие модели еще не превзошел

Уже на Чатбот арене

HF
Чат

#assistant #moe

828

Нейронавт | Нейросети в творчестве

27 Dec, 05:08

OminiControl Training

Опубликован код обучения универсального управляемого генератора изображений OminiControl

Можете обучить свой собственный OminiControl на базе #flux с любым управлением - примерка, 3D, поза или что-либо еще что придумаете.

Только запаситесь двумя NVIDIA H100, 80GB VRAM. Непонятно почему двумя, ведь столько памяти у одной H100, но по ссылке написано именно так

#finetuning #training #conditioning #text2image

1,077

Нейронавт | Нейросети в творчестве

26 Dec, 17:37

Звезда фильмов для взрослых Хлоя Амур продала свой облик ИИ-компании чтобы получать отчисления с вебкам-бота не работая

#news #adult

1,233

Нейронавт | Нейросети в творчестве

26 Dec, 17:16

Stable Diffusion 3.5 Medium Turbo (SD3.5M Turbo)

Высокопроизводительная дистиллированная версия картинкогенератора #SD35 Medium от Tensorart

Поддерживает лоры

#optimization #text2image

1,220

Нейронавт | Нейросети в творчестве

26 Dec, 16:45

SimpleTuner v1.2.2

Обновился инструмент для дообучения диффузных генераторов.

Добавлена поддержка Sana и исправлены баги с обучением SD3.5 (Large + Medium)

реддит

#finetuning

1,214

Нейронавт | Нейросети в творчестве

26 Dec, 13:53

УСПЕТЬ ДО НОВОГО ГОДА

Каждый год мы все воодушевленные ставим цели, но потом что-то идет не по плану…

🎁 А ЧТО ЕСЛИ?
Попасть в закрытую тусовку топовых экспертов, подготовиться и стартануть 2025 год с новыми знаниями

А ещё, прокачать свои навыки, окружение и результаты за последнюю неделю уходящего года — абсолютно БЕСПЛАТНО?

Мы с экспертами подумали над этим… и уверенно говорим ПОГНАЛИ!

НО! Просто собрать папку экспертов и сделать канал было бы слишком скучно!

🥁🥁🥁

я представляю тебе…

✨

Новогодний корпоратив экспертов

где каждый день ты будешь читать ценные тосты и узнавать что-то новое и полезное: идеи, бонусы, разборы и шаги для роста!

👥 5 топовых экспертов уже готовы делиться своим опытом и знаниями

🎄

Плюс к этому ты получаешь:

• комьюнити заряженных людей, готовых расти вместе с тобой

• возможность задать любой вопрос экспертам лично

• ежедневные сюрпризы и подарки, которые реально ценны.

✨ короче, это не просто движуха, а настоящий шанс сделать свой рывок и заработать в Новом году

Жми на ссылку, заходи на Корпоратив и забирай свои бонусы 👇🏻

@ExpertPartyBot
@ExpertPartyBot
@ExpertPartyBot

Не упусти свой шанс — впитать самые актуальные связки, идеи, знания и опыт, чтобы сделать заветную сумму 💵

974

Нейронавт | Нейросети в творчестве

26 Dec, 12:45

HSfM: Reconstructing People, Places, and Cameras

В Беркли придумали новый метод, который совместно реконструирует 3D людей, сцену и камеры из небольшого набора некалиброванных изображений

Посмотреть демо реконструкции
Кода нет

#image2scene #imageto3d #humanreconstruction #camera

1,111

Нейронавт | Нейросети в творчестве

26 Dec, 12:15

ltx-video-0.9-vae-finetune

реддитор сделал файнтюн VAE видеогенератора LTX для борьбы с артефактами

Реддит

#finetune #text2video #video2video #image2video

1,182

Нейронавт | Нейросети в творчестве

26 Dec, 11:28

3DHM: Synthesizing Moving People with 3D Control

Анимация персонажей в полный рост по одному изображению персонажа и образцу движения.

Новый оживлятор человеков в полный рост

Код ждем

#image2video #humananimation #pose2video

1,192

Нейронавт | Нейросети в творчестве

26 Dec, 09:44

Японский метаверс. Now!

Полная копия Токио.
На сайте Пойнт клауды и CityJSON.

Выглядит как полный цифровой близнец, особенно с информацией про автобусы.

Качать и смотреть отсюда:
https://info.tokyo-digitaltwin.metro.tokyo.lg.jp/3dmodel/

Пошуруйте по сайту, интересный

@cgevent

650

Нейронавт | Нейросети в творчестве

24 Dec, 12:17

Пять лет уж минуло с тех пор как мы были на пике глубокого обучения (нейросетей)

1,496

Нейронавт | Нейросети в творчестве

22 Dec, 14:35

Кидайте свежие картинки про роботов и ИИ

#humor

1,885

Нейронавт | Нейросети в творчестве

22 Dec, 09:42

Deep Fourier-based Arbitrary-scale Super-resolution for Real-time Rendering

Свежий апскейлер, рилтайм.

Отличительная особенность - повышает разрешение изображения в любое количество раз.

Судя по всему, предназначен для повышения разрешения рендера игровых движков

Код
Видео от двухминутного доктора

#upscale #realtime

2,666

Нейронавт | Нейросети в творчестве

22 Dec, 08:51

ComfyUI wrapper nodes for HunyuanVideo

Kijai уже прикрутил улучшайзер видеогенерации Enhance-A-Video в свой #ComfyUI пакет

Спасибо @Skubidoo

#text2video

1,628

Нейронавт | Нейросети в творчестве

22 Dec, 07:46

Ну, за мультипликаторов.

Тут Гугль неожиданно выкатил вот такую интересную работу.
И мультик.

Для каждого персонажа свой файнтюн(?!, да, там LoadCheckPoint + Dreambooth SDXL). По 12-то картинкам.

Эти файнтюны генерят кривые руки и пропорции - их корректируют через Depth и Canny контролнеты.
В ComfyUI.

Там же сегментируют персонажей с помощью Dino и SAM.

Часть картинок анимируют с помощью AnimateDiff + DaVinci+Nuke.

А часть - просто ригают и анимируют в Adobe Character Animator.
(Тут мы перестаем пить за мультипликаторов и вопросительно поднимаем бровь). Гугль, это что вообще?

Гугль: это ассистент для аниматоров.

"В рамках этого пилотного проекта мы вместе с художниками разрабатывали новые рабочие процессы для 2D-анимации, одновременно создавая короткометражный образовательный мультфильм. Мы определили несколько рабочих процессов, которые позволят упростить процесс анимации и более эффективно воплотить замыслы художников на экране."

Кода или воркфлоу для Комфи я не нашел.
Но есть кожаные сценарии для эпизодов.

Странная работа.

https://genai-2d-character-animation.github.io/

542

Нейронавт | Нейросети в творчестве

22 Dec, 06:09

INFP: Audio-Driven Interactive Head Generation in Dyadic Conversations

Bytedance продолжают изобретать способы оживлять картинки

Интерактивная генерация головы на основе звука для диадических (парных) разговоров

Получив две дорожки диалога и одно портретное изображение произвольного агента, INFP динамически синтезирует вербальные, невербальные и интерактивные видео агента с реалистичной мимикой и ритмичными движениями позы головы.

Короче, заставит портрет говорить, петь, человечно слушать

Работает в реальном времени, 40 fps на Nvidia Tesla A10
Применимо например для видеоконференций

Код ждем

#audio2video #talkinghead #image2video #portraitanimation #realtime

982

Нейронавт | Нейросети в творчестве

21 Dec, 18:28

На праздничный период пользователи тарифа Plus получают «неограниченный» доступ к #Sora в режиме очереди

Кроме того доступ к Sora дали пользователям Teams

#news

1,196

Нейронавт | Нейросети в творчестве

21 Dec, 15:59

Одна из задач которую o3 не смогла решить, а вы сможете – 2025 жду с нетерпением, очень интересно где мы будем через год в плане АИ-гонки

Все еще жду AGI к 2027

803

Нейронавт | Нейросети в творчестве

21 Dec, 14:17

Kling 1.6

Видеогенератор обновился

Работает быстрее, лучше следует запросам и выдаёт более стабильные и качественные результаты

#text2video

1,210

Нейронавт | Нейросети в творчестве

21 Dec, 13:46

подписки на ИИ сервисы бесплатно к новому году

1. Luma Dream Machine - Промокод: LUMA-MDMZ (3 месяца)
2. ElevenLabs - Промокод: ODYSSEY11 (1 месяц)
3. Udio - Абуз триала (7 дней)

Как залутать?:
1 - Регистрируемся/входим.
2 - Тыкаем на обновить план.
3.1 - LUMA: тыкаем на месячную Plus подписку
3.2 - ElevenLabs: тыкаем на Starter подписку
3.3 - Udio: там где Standard тыкаем на Trial
4 - Нас перекидывает на страничку оплаты, там мы вводим промокод(для Udio не нужно)
5- Вводим данные сгенерированной карты(см. комментарии к посту), имя владельца от балды, Адресс - хз, но я выбирал штаты, далее адресс от балды, далее город например : Miami, почтовый индекс: 33152, штат сам подтянется, ну а после - подписаться
6 - Поздравляю, у вас халявная подписочка.

P.S Касаемо Udio, после всех вышеописанных действий, этот Trial нужно ещё активировать, активируем в том же окошечке с подписками в окошечке Standard, абузить Udio подобным методом можно сколько угодно, меняете почту, и вперёд.

4. LTX - промокод LTXODYSSEY на Standard план
5. Hedra - промокод HEDRAODYSSEY на базовый план
6. Freepik - 2 месяца бесплатного пользования

7. Leonardo - 5000 кредитов через день, после заполнения анкеты.
8. Viggle - Так же после заполнения анкеты

Стырил у @AINetSD

#халява

1,470

Нейронавт | Нейросети в творчестве

21 Dec, 13:16

mage.space

Кстати, тут раздают бесплатный Hunyuan
Надо будет зарегаться и избегать запрещенок всяких, в остальном генерация видео бесплатна

5 секунд видео 360*640 15fps генерится за минуту.
Обещают в будущем сделать HD

#text2video #online

1,289

Нейронавт | Нейросети в творчестве

21 Dec, 12:45

Enhance-A-Video: Better Generared Video for Free

Улучшайзер видеогенраторов
Прикручено к Hunyuan и CogvideoX

Код

#text2video

1,178

Нейронавт | Нейросети в творчестве

21 Dec, 12:05

1-800-242-8478

Позвонив по этому номеру из США или Канады можно поговорить с ChatGPT.

Полезно например если нет интернета а телефонная связь есть.

Из остальных стран где есть доступ к ChatGPT можно писать на этот номер по ватсапп. Меня игнорит, ну оно и понятно

#assistant #voicechat #news

1,092

Нейронавт | Нейросети в творчестве

07 Dec, 11:43

NitroDiffusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training

Генератор картинок.
Принципиально новый подход к диффузной генерации за один шаг с использованием динамической состязательной сети

Есть два чекпойнта: NitroSD-Realism и NitroSD-Vibrant

Репозиторий HF
Демо

388

Нейронавт | Нейросети в творчестве

07 Dec, 10:34

BRIA 2.3 ControlNet Generative Fill

Быстрый инпейнтинг от BRIA
Предлагают купить API чтобы делать юридически чистые картинки.
Но можно потыкать в демо и скачать веса.
Код на странице модели

Не рисует ни Бендера, ни Пепе

Демо
Веса

#inpainting

494

Нейронавт | Нейросети в творчестве

07 Dec, 09:19

NVComposer: Boosting Generative Novel View Synthesis with Multiple Sparse and Unposed Images

По одному или нескольким изображениям-ракурсам сцены генерирует новые ракурсы и из них - видео

Черрипик и нечеррипик

Код ждем на днях
Демо

#novelview #cameracontrol #image2video

555

Нейронавт | Нейросети в творчестве

06 Dec, 10:55

Вниманию пользователей СomfyUI

Пакет Ultralytics, необходимый для FaceDetailer версий v8.3.41 и v8.3.42 был скомпрометирован и содержит майнер. Пока что пострадали только пользователи macOS и Linux. Но чтобы обезопасить себя на Windows, рекомендую удалить любой Ultralytics и поставить версию 8.3.40.
Официальный источник

Как это сделать:
1. Зайдите в корень ComfyUI (там, где лежит папка python_embeded и файл run_nvidia_gpu.bat)
2. В адресной строке проводника (там, где видите путь) нажмите в пустом месте. Выделится путь, сотрите его и наберите cmd и нажимаете ⏎ Enter, чnобы открылась консоль.
3. В открывшейся консоли выполните этот код:

set appdata=tmp
set userprofile=tmp
set temp=tmp
set path=python_embeded
python -m pip uninstall -y ultralytics
python -m pip install ultralytics==8.3.40

Он удалит все пакеты Ultralytics и установит чистые не заражённые, версии 8.3.40

#news

1,111

Нейронавт | Нейросети в творчестве

06 Dec, 09:12

Align3R: Aligned Monocular Depth Estimation for Dynamic Videos

Генерирует для видео консистентные глубину, облака точек, камеру

Код
Интерактивная галерея

#video2depth #video2pointcloud #video2camera #tracking

864

Нейронавт | Нейросети в творчестве

06 Dec, 08:44

Imagine360: Immersive 360 Video Generation from Perspective Anchor

Делает из обычного видео сферичекое панорамное. Для этого, ясно, надо дорисовывать невидимые в исходнике части

Код ждем в январе

#video2panorama #panorama #video2VR

866

Нейронавт | Нейросети в творчестве

06 Dec, 08:14

One Shot, One Talk: Whole-body Talking Avatar from a Single Image

Реконструкция выразительного говорящего аватара в полный рост по одному изображению. Мимика, жестикуляция, все дела.
Под капотом гибридное представление аватара в виде 3DGS-меша

Код ждем

#humanavatar #humananimation #speech2video #talkinghead #gaussian

909

Нейронавт | Нейросети в творчестве

06 Dec, 07:47

Director

Думайте о Director как о ChatGPT для видео. Это платформа для создания видеоагентов, которые могут решать сложные видео-задачи, такие как поиск, редактирование, компиляция, генерация и т.д., и мгновенно транслировать результаты.

Код
Попробовать онлайн первые 50 видео - бесплатно

#videoediting #online #text2video #text2audio #text2movie

941

Нейронавт | Нейросети в творчестве

06 Dec, 07:18

В Anychat продолжают прикручивать всякие ништяки. Из интересного помимо языковых моделей:

- генератор картинок Luma Photon
- генератор видео hunyuan video (вкладка Replicate)
- Flux tools (вкладка Replicate)
- генератор видео ltx video (вкладка fal)
- генератор речи Play.ai

Пользуемся: Anychat

#text2video #video2video #image2video #text2speech #controlnet #conditioning #image2image #text2image #flux

915

Нейронавт | Нейросети в творчестве

06 Dec, 06:51

MV-Adapter: Multi-view Consistent Image Generation Made Easy

Генерация изображения сразу с нескольких (до 40) ракурсов на базе #SDXL, 768*768

Код
Демо t2i animagine
Демо t2i general
Демо i2i

#multiview #text2image #image2image #text2multiview #image2multiview

964

Нейронавт | Нейросети в творчестве

05 Dec, 11:39

MultiFoley

Генератор звука по видео от Adobe
Кода нет, ждем в Premiere

#video2sound #video2audio

1,065

Нейронавт | Нейросети в творчестве

05 Dec, 08:51

Уже на tost.ai

640x368, 5 секунд

#text2video

1,060

Нейронавт | Нейросети в творчестве

05 Dec, 08:15

FLOAT: Generative Motion Latent Flow Matching for Audio-driven Talking Portrait

Оживлятор портретов по звуку речи с контролем эмоций

Код ждем

#talkinghead #speech2video #facialanimation

1,129

Нейронавт | Нейросети в творчестве

27 Nov, 07:31

ComfyUI Desktop V1 (beta)

Свершилось. Десктопное приложение наконец выпустили в опенсорс.
Для Windows (NVIDIA) и macOS (серия M)

Гитхаб
Инструкция (в т.ч. по установке)

#comfyUI #news #desktop

543

Нейронавт | Нейросети в творчестве

26 Nov, 17:00

Sora якобы слили в интернет

Это может оказаться неправдой

Но можно попробовать потыкать демоспейс если повезет

Демо

#news #text2video

833

Нейронавт | Нейросети в творчестве

26 Nov, 15:38

ControlNets for Stable Diffusion 3.5 Large

Какое совпадение - 2
Вслед за Blackforest Labs, Stability AI выпускают пачку контролнетов к SD 3.5 Large

Blur - апскейлер до 8К и 16К
Canny
Depth

Веса на HF
Гитхаб
Уже в ComfyUI

#conditioning #controlnet #sd35 #text2image #upscale #depth2image

863

Нейронавт | Нейросети в творчестве

26 Nov, 13:33

Mago Studio

Сервис для стилизации/преобразования видео
от автора Warpfusion &Co
Приятно видеть в команде и другие знакомые лица

Запуск в 2025. Обещают бесплатный локальный запуск базового функционала. Видимо,за счет этого и будут конкурировать со всякими ранвеями

Записаться в бетатестеры

#video2video #styletransfer #stylization

869

Нейронавт | Нейросети в творчестве

26 Nov, 12:26

Runway Frames

Какое совпадение! У runwayml тоже свой генератор картинок.

Позволяет создавать ни много, ни мало - свои миры, и в них генерить картинки

Думаю, речь о работе со стилями, персонализациями и все такое.
Зайдите на сайт, там много всего

Го тестить (за ваши деньги)!

#text2image #online

886

Нейронавт | Нейросети в творчестве

26 Nov, 10:47

Kolors Character with Flux

Демоспейс песонализации от команды Kwai Kolors в топе на HF.
Вероятно как-то поженили Kolors с Flux, с первого взгляда непонятно как.
Бендера не смог персонализировать

А также его брат демоспейс
Kolors Portrait with Flux

#personalization #text2image

894

Нейронавт | Нейросети в творчестве

26 Nov, 10:25

Text-Guided Image Colorization

Колоризация изображений с текстовыми подсказками на базе SDXL/SDXL-Light

Код
Демо

#colorize

855

Нейронавт | Нейросети в творчестве

26 Nov, 10:04

Fugatto

Новая базовая аудиомодель от Nvidia на 2.5B параметров.
Может если не все, очень много:
звуковые эффекты по текстовому промпту, речь по тексту, музыка, сделать один музыкальный инструмент из другого, добавить музыкальный инструмент в трек, изолировать источник звука из трека.

Попробовать не дают, кода нет

#music #music2music #audioediting #text2sound #text2speech #musicediting

900

Нейронавт | Нейросети в творчестве

26 Nov, 08:02

Охо-хо-хо! Подарок к новому году🎅

Дарю 50 мест на прохождение курса
“Деньги на Телеграм” — БЕСПЛАТНО! 🎁

Подпишись на канал и забирай курс:
👉https://t.me/+ENN3JvahOBozMDhi

На курсе ты узнаешь:

🎄Как зарабатывать первые 100.000 рублей с нуля
🎄Лучшие инструменты для привлечения клиентов через Телеграм
🎄Как построить автоворонку с помощью искусственного интеллекта
🎄Как превратить фриланс в прибыльный бизнес на 100 тыс, 200 тыс и даже 1 млн рублей!

🔥 Ценность курса — ~~25.000 рублей~~, для тебя — БЕСПЛАТНО! 🔥

⏳ Ссылка действует только 24 часа!
👉https://t.me/+ENN3JvahOBozMDhi

✨ Новый год — новые цели! Встречай 2025 с навыками, которые принесут свободу и доход!

Успей! Мест всего 50.

#промо

848

Нейронавт | Нейросети в творчестве

26 Nov, 07:33

Крупное обновление получил видеогенератор Dream Machine
Теперь это рабочая среда, комбайн технологий.
Авторы предлагают начинать творческий процесс с генерации картинок.

Да, у них появился свой картинкогенератор Luma Photon
В картинки можно вносить изменения, делать из них видео. Для видео задавать первый и последний кадр, движение камеры. Удлинять (Extend), задавая конечный кадр.
Brainstorm - генератор идей
И это кажется еще не все

Официальный туториал

#text2image #text2video #image2video #videoediting #imageediting #online #tutorial #cameracontrol #videoextension

1,387

Нейронавт | Нейросети в творчестве

20 Nov, 10:01

GeneX: Generative World Explorer

Интересная работа.
Модель обучили ориентироваться в пространстве подобно человеку, учитывая известные объекты вне поля зрения

#news #worldunderstanding

176

Нейронавт | Нейросети в творчестве

20 Nov, 09:33

JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation

Портретная анимация по звуку речи для людей и животных

Код

#facialanimation #speech2video #image2video #talkinghead

320

Нейронавт | Нейросети в творчестве

20 Nov, 09:04

AnimateAnything: Consistent and Controllable Animation for video generation

Очередная попытка управлять движением при генерации видео

Код ждем

#cameracontrol #motioncontrol #image2video

404

Нейронавт | Нейросети в творчестве

20 Nov, 08:25

Anychat

Неплохой подарочек
В этом демоспейсе есть большинство топовых LLM, даже Pixtral Large уже завезли.

Для коммерческих конечно понадобится токен

#assistant #llm

494

Нейронавт | Нейросети в творчестве

20 Nov, 07:40

Pixtral Large 124B

Mistral AI релизнули зубастую модель и обновили Le Chat. Отличная альтернатива ChatGPT/Claude, да еще и работает без VPN

в чате:

- Веб-поиск

- Canvas - аналог OpenAI Canvas

- Понимание PDF и изображений

- Flux Pro!

Чат

#assistant

569

Нейронавт | Нейросети в творчестве

19 Nov, 17:38

Suno v4

Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен

#text2music #music2music

922

Нейронавт | Нейросети в творчестве

19 Nov, 15:39

GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation

Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?

Код ждем
Демо ждем

#textto3d #text2gaussian #gaussian

944

Нейронавт | Нейросети в творчестве

19 Nov, 13:02

Что не так с LLM?

— API не так дёшевы, как кажется
— Даже большие LLM галлюцинируют
— RAG сходу не работает
— Инференс без оптимизации стоит дорого
— Модели игнорируют инструкции

Про эти и другие проблемы расскажут ребята из DeepSchool на zoom-лекции в четверг. Приходите, чтобы узнать о болячках LLM и как с ними бороться!

А также вы познакомитесь с программой курса LLM, на котором научитесь использовать LLM в приложениях: обучать, деплоить, ускорять и многое другое!✨

👨‍💻Обо всём этом расскажут:
- Илья Димов — Senior NLP-инженер
- Тимур Фатыхов — ex Lead CV Engineer, основатель DeepSchool

📆

Четверг, 21 ноября, 18:00 МСК.

🎁 После регистрации вы получите список полезных инструментов и библиотек для работы с LLM.

Регистрируйтесь на лекцию по ссылке!

#промо

948

Нейронавт | Нейросети в творчестве

19 Nov, 10:10

Ultravox

Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!

Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API

Гитхаб
Веса
Демо

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online

1,742

Нейронавт | Нейросети в творчестве

19 Nov, 08:20

Говорят, можно обучить лору #flux на нескольких персонажей. Сам не пробовал

Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются

Видео
Реддит

#lora #tutorial

1,005

Нейронавт | Нейросети в творчестве

19 Nov, 07:53

SuperSplat 1.9.0

Опенсорсный редактор 3D сцен на гауссианах

Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.

Код
Попробовать онлайн

#gaussian #3Dedit

1,017

Нейронавт | Нейросети в творчестве

18 Nov, 08:28

LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

Понимание и генерация 3D сеток языковой моделью.

В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.

Налетаем, пробуем.

Код
Веса
Демо

#textto3d #3dtotext #assistant

1,113

Нейронавт | Нейросети в творчестве

18 Nov, 08:13

MagicQuill: An Intelligent Interactive Image Editing System

Редактор картинок с GUI, под капотом #SD 1.5 и мультимодальная LLM

Код
Демо

#imageediting

1,140

Нейронавт | Нейросети в творчестве

18 Nov, 07:52

MinerU

Инструмент для преобразования PDF документов в машинно-читаемые форматы (markdown, JSON и т п)

Гитхаб
Демо

#tools #pdf

1,070

Нейронавт | Нейросети в творчестве

18 Nov, 07:33

Athene-V2-Agent

Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах

Дообучен из Qwen-2.5-72B-Intruct

#assistant #agent

1,149

Нейронавт | Нейросети в творчестве

17 Nov, 11:08

Код RayGauss тоже недавно выложили
Готовьте 24ГБ VRAM для качества как у авторов

Код

#gaussian #rendering #novelview

1,160

Нейронавт | Нейросети в творчестве

17 Nov, 11:03

Кстати код гауссиан с релйтингом уже доступен

Код

#relighting #gaussian #novelview

1,151

Нейронавт | Нейросети в творчестве

16 Nov, 11:20

Увидел что тут не хватает мема про ИИ или роботов - прояви ~~гражданскую~~ мемную позицию в комментариях

#humor

1,307

Нейронавт | Нейросети в творчестве

15 Nov, 14:35

Stable Diffusion 3.5 Prompt Guide

Официальное руководство по написанию промптов для #SD35

#prompting #Guide #tutorial

1,217

Нейронавт | Нейросети в творчестве

15 Nov, 08:37

Text Behind Image AI Editor

Хит этой недели. Инструмент для добавления текста за объектом.

И сразу альтернатива на gradio - чуть меньше интерактивности, а по сути то же самое.

Оба инструмента поддерживают русский язык. Затестил обе. Gradio сделал лучше, без кантов

#imageediting #tools

1,341

Нейронавт | Нейросети в творчестве

15 Nov, 07:57

ControlNet Union Pro fp8

Квантизованная версия ControlNet Union для Flux.
У нищебродов (меня) будет работать быстрее оригинальной

#flux #controlnet

1,271

Нейронавт | Нейросети в творчестве

15 Nov, 07:41

Edify 3D: Scalable High-Quality 3D Asset Generation

Генератор 3D объектов с PBR материалами от NVIDIA. Красиво, но этих рыбов только показывают

Кода нет

#textto3d

1,150

Нейронавт | Нейросети в творчестве

14 Nov, 15:23

SD3.5 Large на Amazon

Stable Diffusion 3.5 Large завезли на облачную платформу ИИ-сервисов Amazon SageMaker JumpStart. Теперь можно пилить сервисы на SD35 Large прямо там

#news

1,193

Нейронавт | Нейросети в творчестве

14 Nov, 12:53

#neuronaut_art

1,706

Нейронавт | Нейросети в творчестве

14 Nov, 11:05

Появился демоспейс кручуна-верчуна картинок DimensionX

Демо

#cameracontrol #image2video

1,729

Нейронавт | Нейросети в творчестве

14 Nov, 10:25

RMBG 2.0
BRIA Background Removal v2.0

Обновка крутого удалятора фона RMBG
Потестил в демо - раз на раз не приходится.

Демо

#image2image #backgroundremoval

988

Нейронавт | Нейросети в творчестве

14 Nov, 10:03

SeedEdit: Align Image Re-Generation to Image Editing

И еще один новый генератор картинок, на этот раз от ByteDance. И не простой, а редактирующий.

Умеет всякое-разное: смена стиля, удаление/замена

Кода нет, опенсорсом не пахнет
Демо с огромной очередью желающих

#text2image #image2image #imageediting

857

Нейронавт | Нейросети в творчестве

13 Nov, 10:03

Нейросети теперь могут приносить деньги. Но как?

👉🏻 Представьте, что вы делаете посты для тг-канала с помощью ИИ. Причём посты не отличить от написанных человеком.

За пост вам платят 100-200 рублей. В день можно делать 100 постов — за вас их делает нейросеть.

Это один из 30 спосбов заработать на нейросетях.

📌 И вы можете научиться делать такие и другие задачи на нейросетях легко!

Новичку без опыта в такой теме зарабатывает от 15 до 70 тыс рублей в месяц.

Ниша сейчас свободна, много заказов и мало качественных исполнителей.

🟢 Приглашаю на 3х дневный бесплатный марафон, в рамках которого вы:
1️⃣ Разработаете своего нейропомощника
2️⃣ Создадите портфолио для заказов
3️⃣ Научитесь находить заказы

Начало марафона - завтра. В первый же день вы создадите своего первого нейропомощника по простым инструкциям.

▶️ Переходите в закрытый канал, чтобы принять участие. Места ограничены, ссылка на 20 мест → https://t.me/+zjArys0KdmxkZmFi

Реклама.

183

Нейронавт | Нейросети в творчестве

13 Nov, 09:47

Смотрите что можно делать с DimensionX

#cameracontrol

291

Нейронавт | Нейросети в творчестве

13 Nov, 09:32

Regional Prompting FLUX

К флюксу прикрутили промптинг по заданным областям. Области задаются сегментными масками

Гитхаб

#flux #text2image

332

Нейронавт | Нейросети в творчестве

13 Nov, 09:03

ComfyUI RyanOnTheInside

Докатились. Симуляции в #ComfyUI
Партиклы. С реакцией на звук, MIDI, движение, время, цвет, глубину

#particles #dynamics

385

Нейронавт | Нейросети в творчестве

13 Nov, 08:31

На tost.ai можно крутить DimensionX не только влево

#cameracontrol

440

Нейронавт | Нейросети в творчестве

13 Nov, 08:00

Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models

Генерация фотореалистичных изображений с пиксельной точностью от Nvidia. Отсутствует CLIP, пиксельное пространство вместо латентного.

Фичи:
- картинки по тексту
- ControlNet-апсемплинг до 4K (генератор выдает 1K)
- поддерживает Controlnet, сети управления
- HDR панорамы 360°
- дообучение, в том числе на несколько объектов

Впечатляет, но

Кода нет

#text2image #panorama #HDR #conditioning #upscale

453

Нейронавт | Нейросети в творчестве

12 Nov, 17:03

Mochi + FasterCache

Ускоритель видеодиффузии FasterCache прикрутили к Mochi, получив сокращение времени генерации почти вдвое. Обещают gradio демо

твиттер

#optimization #text2image

828

Нейронавт | Нейросети в творчестве

12 Nov, 16:36

Qwen2.5-Coder-Artifacts

Еще один демоспейс Qwen2.5-Coder
наподобие Claude artifacts

+ Qwen2.5-Coder 32B доступен в Hugging Chat

#coding #assistant

794

Нейронавт | Нейросети в творчестве

12 Nov, 16:10

e2-f5-tts multilingual

В голосовой модели e2-f5 мультиязычная обновка. Теперь можно клонировать голос и подгружать свои файнтюны, несколько готовых есть. Русского не нашел

Приложение доступно в Pinokio

Инструкция в твиттере

Демо (без файнтюнов)

Гитхаб

#text2speech #tts #voicecloninhg

810

Нейронавт | Нейросети в творчестве

12 Nov, 12:43

Qwen2.5-Coder

Обновка LLM для работы с кодом Qwen
По бенчмаркам - уровень gpt4o
Опенсорс, доступны 0.5B / 1.5B / 3B / 7B / 14B / 32В. Можно запустить локально

Модели на HF
Демо
Гитхаб

#coding #assistant

886

Нейронавт | Нейросети в творчестве

12 Nov, 10:35

Обновился генератор видео от Alibaba EasyAnimate до версии v5

Разрешение до 1024x1024, 49 кадров, 8 кадров в секунду, генерация по картинке (финальный кадр тоже можно указать!)
Поддержка #ComfyUI, Lora, Controlnet.
Запаситесь 24 GB VRAM

Демо
ComfyUI
Гитхаб

Веса:
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-InP
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-Control

#text2video #image2video

909

Нейронавт | Нейросети в творчестве

10 Nov, 15:27

Инфа от посетителя.
В целом интересно побывать на таком мероприятии, хотя ничего нового для тех кто в курсе что видео можно генерировать.

Впечатлил клип на неизданный трек Кирилла Толмацкого aka Дэцл.

Артист ушел из жизни в 2019 году. После чего его отец Александр Толмацкий обнаружил на флешке неизданный трек Кирилла и постарался довести его до финального качества. На этот трек и был создан видеоклип с использованием видеогенераторов участвовавший в конкурсе ИИ фильмов.

Кто знает где посмотреть клип - киньте ссылку, посмотрим вместе

[update] спасибо @lovelettertomyheart

Клип:
https://www.youtube.com/watch?v=F7FO0HRZ2QY

#event

459

Нейронавт | Нейросети в творчестве

09 Nov, 11:20

Вот и настала чудесная пора, очей очарование.
День мемов. А вы что подумали?

Сдаем мемы про роботов и ИИ на шторы в канал.
Кто не сдаст мем не попадает на общее фото

#humor

893

Нейронавт | Нейросети в творчестве

09 Nov, 09:16

Исследователи из Neiry и МГУ подключили мозг крысы к искусственному интеллекту.

Для этого они имплантировали инвазивный нейроинтерфейс в мозг животного. Электроды интерфейса стимулируют отдельные зоны мозга.

Интерфейс подключен к языковой модели.
При положительном или отрицательном ответе на вопрос крысе отправляется соответствующий сигнал. В зависимости от места стимуляции крыса испытывает ощущения. На видео видно, как крыса отвечает на разные вопросы и получает вознаграждение за правильные ответы.

#news

936

Нейронавт | Нейросети в творчестве

08 Nov, 14:27

Loras in Krea

Обучение лор для #Flux (и не только?) на Krea.ai

Сейчас идет запись в вейтлист, но если успеете "в первую сотню" желающих, получите доступ сразу. На странице вейтлиста внизу мелким шрифтом "I have access code". Возможно, появится после подачи заявки. Жмем и вводим пароль:

EARLYBIRD

Записаться в вейтлист

Подсмотрел у Сергея Цыпцына

#lora

938

Нейронавт | Нейросети в творчестве

08 Nov, 12:39

Learn About

Генератор интерактивных статей и гайдов на любую тему.
Пишем запрос на тему, в которой хотим разобраться - получаем готовую интерактивную статью с введением, основными терминами и актуальностью, ссылками на смежные темы и возможность задавать вопросы, углубляясь в тему.

Я сначала написал запрос на английском, потом в вопросах решил потестить русский. Основная LLM успела в ответ написать мне один абзац на чистом русском, но в ту же секунду цензура заменила его на "Sorry, but I don't speak that language yet." Ага, ага. Не не умеешь, а дискриминируешь 👀

Да, для пользования включайте американский VPN

#assistant #search

960

Нейронавт | Нейросети в творчестве

08 Nov, 09:55

CogVideoX1.5-5B-SAT

Апгрейд CogVideoX. Генератор видео по тексту и по картинке.

CogVideoX1.5-5B поддерживает 10-секундные видеоролики высокого разрешения (1360 * 768). Пишут что для такого разрешения надо 66ГБ VRAM

CogVideoX1.5-5B-I2V поддерживает любое разрешение (!??). Видимо, речь о разрешении входной картинки

Демки нет. кто умеет - запускаем самостоятельно

#image2video #text2video

5,570

Нейронавт | Нейросети в творчестве

08 Nov, 09:31

ReCapture: Generative Video Camera Controls for User-Provided Videos using Masked Video Fine-Tuning

В гугле придумали как добавить в рандомное статичное видео движение камеры. Но нам не рассказали

Кода нет

#video2video #novelview #cameracontrol

923

Нейронавт | Нейросети в творчестве

08 Nov, 09:05

Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

Генератор глубины по изображению. Хвастаются песпрецедентным качеством и скоростью - 0.3 секунды на 2.25МПикс картинку на потребительском GPU

Код
Веса
Демо

#image2depth

942

Нейронавт | Нейросети в творчестве

08 Nov, 08:33

X-Portrait 2: Highly Expressive Portrait Animation

То же самое, но круче.
Есть сравнение с Runway Act

Код ждем

#facialanimation #portraitanimation #headanimation #motioncloning #personalization

987

Нейронавт | Нейросети в творчестве

02 Nov, 15:40

У меня есть скромное мнение что люди которые работают по выходным и выдают контент так же как и по будням - психи.

А может, я просто завидую.
Вот, успел набрюзжать до того как санитары на прогулку забрали

#оффтоп

530

Нейронавт | Нейросети в творчестве

02 Nov, 11:45

Суббота. Вы знаете что это значит. Сдаем мемовый оброк на околоИИшные темы

#humor

719

Нейронавт | Нейросети в творчестве

01 Nov, 15:03

HelloMeme: Integrating Spatial Knitting Attentions to Embed High-Level and Fidelity-Rich Conditions in Diffusion Models

Это не генератор мемов, как можно заключить по названию, а очередной опенсорсный инструмент для переноса портретной анимации.

Работает ли оно только на SD1.5 (с лорами, кстати) или с более новыми генераторами картинок тоже - непонятно

Обратите внимание на заявленное превосходство над Liveportrait

Код

#pose2video #facialanimation #portrait2video #personalization

904

Нейронавт | Нейросети в творчестве

01 Nov, 13:18

У Meta AI тоже обновка

ИИ-функции теперь интегрированы в инстаграм, фейсбук, ватсапп (продукты, запрещенной в РФ Мета)

Камерун - да. Россия - нет 🤩

#news

925

Нейронавт | Нейросети в творчестве

01 Nov, 12:50

Suno Personas

В генераторе музыки Suno появилась возможность создавать собственных исполнителей — Personas.

Принцип работы прост: выбираете Suno-трек с понравившимся голосом, нажимаете кнопку Make Persona, и последующие треки можете генерить с этим голосом

Бета доступна подписчикам Pro и Premier. На старте дают сгенерировать 200 треков, далее платно по 10 кредитов за трек

#text2music #music2music #news

954

Нейронавт | Нейросети в творчестве

01 Nov, 12:37

Bolt.new

Пишем какое нужно приложение — Болт создаёт полноценный веб-сервис (фронтенд, бэкенд) весьма шустро.
Приложение работает в песочнице для проверки и редактирования кода.
Развёртывается публично в интернете одним нажатием кнопки.
20 тысяч токенов в день бесплатно, 10 миллионов токенов в месяц за 20$.

#coding

986

Нейронавт | Нейросети в творчестве

01 Nov, 11:34

Cursor

ИИ-редактор кода на основе VS Code. Несколько провадеров LLM на выбор.
Есть бесплатный тариф

#coding

893

Нейронавт | Нейросети в творчестве

01 Nov, 05:45

AMA with OpenAI’s Sam Altman, Kevin Weil, Srinivas Narayanan, and Mark Chen

Вчера на реддите Сэм Альтман с группой товарищей провели сессию ответов на вопросы юзеров. Огромный тред, есть герои почитать?

#news

939

Нейронавт | Нейросети в творчестве

01 Nov, 05:23

ChatGPT search

ChatGPT научили гуглить (вероятно, этот термин в ближайшем будущем заменят на что-то другое)

Платным подписчикам и тем кто попал в вейтлист - уже. Бесплатным пользователям - в ближайшие месяцы.

#search #nws #assistant

934

Нейронавт | Нейросети в творчестве

01 Nov, 05:03

3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes

Очередная бомбическая работа от NVIDIA.
Поженили гауссианы с рейтрейсером.
За счет этого можно в сцену добавлять объекты, отрабатывают тени, отражения, преломление, глубина резкости. Можно наруливать материалы, и они будут работать.

Работает довольно шустро - 78 кадров в секунду на датасете MipNeRF360 на NVIDIA RTX 6000 Ada

Есть только препринт, кода нет. Вопрос куда это прикрутят? Вернее, когда

#rendering #gaussian #material #news

922

Нейронавт | Нейросети в творчестве

31 Oct, 19:46

Blendbox

Blockadelabs, известные нам генератором объемных панорам, выпустили свой нейроредактор изображений.

Здесь есть слои и "рилтаймовый" холст, напоминающий Krea.ai

Все это добро, видимо, платное. Попробовать бесплатно мне не удалось

#text2image #image2image #realtime #imageediting

1,021

Нейронавт | Нейросети в творчестве

31 Oct, 17:04

UDIO Edit

В генераторе музыки обновка инпейнтинга

Легкая замена любого кусочка музыки или слов

Выбираем трек. Жмем Edit, а затем Replace Section или Edit Lyric.

Функция доступна в десктопных браузерах и только для платных подписчиков

#inpainting #musicediting

1,055

Нейронавт | Нейросети в творчестве

31 Oct, 16:34

Claude for Desktop Beta

Официальное приложение Claude с Sonnet 3.6 под #Windows / #MacOS

Ссылки я для вас достал через VPN, дальше сами

Win
Win (arm64)
macOS

#desktop #assistant

1,140

Нейронавт | Нейросети в творчестве

31 Oct, 07:02

Дизайн интерьера с нейросетями: ускорь процессы и увеличь доход!

Ты можешь делегировать нейросети:
✅ создание концепций, дизайн и визуализацию
✅ контент план и развитие личного бренда
✅ маркетинг и бизнес процессы

Где взять инфу?

Подпишись на канал эксперта, который уже создал более 100 интерьеров с помощью ИИ в России и на Бали. Все секреты дизайна с использованием нейросетей здесь👇

🎁А в закрепе тебя ждут уроки и гайды по нейросетям, которые подойдут как новичкам, опытным профессионалам, так и предпринимателям!
Подписывайся и смотри👇

https://t.me/+BkzviAJvVY81ODcy

Бесплатно для первых 50 человек⚠️

#промо

968

Нейронавт | Нейросети в творчестве

27 Oct, 17:34

У нас в чате Константин принимает запросы на тест дубляжа по лицам от Runway

https://t.me/greenrobotschat/16028

657

Нейронавт | Нейросети в творчестве

27 Oct, 15:19

IC-Light V2

Вторая версия релайтера, на базе Flux
Умеет корректно работать со стилизованными изображениями, нативное высокое разрешение

Код ждем
Демо пробуем

#relighting

808

Нейронавт | Нейросети в творчестве

26 Oct, 11:16

База от Fiverr (биржи фрилансеров)

#humor

1,242

Нейронавт | Нейросети в творчестве

26 Oct, 08:37

Всем кто не ставил лайки на этой неделе, назначаем штраф мемами

#humor

1,160

Нейронавт | Нейросети в творчестве

25 Oct, 16:49

Опубликован код аватара на гауссианах DreamWaltz-G

Код

#text2avatar #text2gaussian #humanavatar

1,193

Нейронавт | Нейросети в творчестве

25 Oct, 16:17

Framer: Interactive Frame Interpolation

Интерполяция кадров с контролем траектории.
Кажется, пора уже вводить термин креативная интерполяция кадров

Код ждем 28 октября
Демо ждем

#frameinterpolation #slowmotion #motioncontrol

1,178

Нейронавт | Нейросети в творчестве

25 Oct, 15:47

Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs

Ну и оказывается, у Apple есть чем крыть.
Понималка мобильных интерфейсов.

Есть только препринт

#screen2text #agent #assistant

1,002

Нейронавт | Нейросети в творчестве

25 Oct, 14:55

OmniParser: Screen Parsing tool for Pure Vision Based GUI Agent

Познакомьтесь с OmniParser — компактным модулем анализа экрана, который может преобразовывать скриншоты пользовательского интерфейса в структурированные элементы. OmniParser можно использовать с различными моделями для создания агентов, способных выполнять действия в пользовательских интерфейсах. При использовании с GPT-4V он значительно повышает способность агента генерировать точные действия для областей интерфейса.

Иначе говоря, OmniParser+GPT-4V = конкурент Claude Computer Use

Код

#screen2text #agent #assistant

1,150

Нейронавт | Нейросети в творчестве

25 Oct, 14:23

KlingAI Virtual Try-On

Если вам не хватало виртуальных примерочных то вот еще одна, на API клинга

Код

#image2image

959

Нейронавт | Нейросети в творчестве

25 Oct, 13:55

Computer Use - OOTB

Уже слышали про Claude Computer Use?
Приложение-агент от Anthropic для автоматизации любых задач на локальном компьютере?

Вот вам способ установки без докера. Бонусом - удаленное управление компом с мобилки.

Код

Альтернатива: agent.exe

#assistant #agent #tools

1,077

Нейронавт | Нейросети в творчестве

25 Oct, 13:34

MFLUX-WEBUI

Для вас, маководы
GUI для работы с #Flux
Контролнет, интерграция с Civitai и прочие свистоперделки в комплекте

Есть в Pinokio

Гитхаб

#tools #mac

1,082

Нейронавт | Нейросети в творчестве

25 Oct, 13:08

VistaDream: Sampling multiview consistent images for single-view scene reconstruction

Дерзко. Создает 3D сцену на гауссианах из одной картинки

Код
Галерея

#gaussian #image2scene #imageto3d #image2gaussian

1,068

Нейронавт | Нейросети в творчестве

25 Oct, 13:01

Flux.1 Lite alfa

альфа-версия Flux.1 Lite от Freepik с 8B параметров, дистилированной из FLUX.1-dev (а dev, напоминаю - дистилированная из pro). Эта версия использует на 7 ГБ меньше оперативной памяти и работает на 23% быстрее при сохранении той же точности (bfloat16), что и оригинальная модель.

Репозиторий на HF

#flux #text2image

1,299

Нейронавт | Нейросети в творчестве

25 Oct, 12:46

SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree

Улучшенный SAM2 для сегментации длинных видео

Код

#segmentation #video2mask

987

Нейронавт | Нейросети в творчестве

25 Oct, 12:27

IntraPaint

Редактор картинок на базе Forge/A1111 (запускать с ключом --api). В будущем - и на ComfyUI

Гитхаб
Видео

#tools #imageediting #text2image #image2image #inpainting

956

Нейронавт | Нейросети в творчестве

23 Oct, 05:03

JoyCaption Alpha 2 - Batch Script

Скрипт для пакетной обработки картинок в JoyCaption.

Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии

Реддит

#image2text #captioning

807

Нейронавт | Нейросети в творчестве

22 Oct, 19:02

Mochi 1

Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)

Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)

#text2video

1,116

Нейронавт | Нейросети в творчестве

22 Oct, 15:54

Итак, кастомизация SD3.5

Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM

Официальный гайд

готовые лоры:
раз
два
три
———————————
Примеры ComfyUI

———————————
SD3.5-fp8 (пожатая модель)

Спионерил у @SergeyTsyptsyn

#lora #text2image #comfyui #finetuning

1,187

Нейронавт | Нейросети в творчестве

22 Oct, 14:28

Stable Diffusion 3.5

Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.

Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября

Уже поддерживается в ComfyUI

Модель HF
Гитхаб

Демо HF
API
Replicate

#text2image #news

1,183

Нейронавт | Нейросети в творчестве

22 Oct, 11:33

Короче, код Sana собираются опубликовать. Как стало ясно из комментария на гитхабе, ждут внутреннего одобрения

#news

1,074

Нейронавт | Нейросети в творчестве

22 Oct, 08:55

Мемная нейроптица с огромными тестикулами залетела к профессору МГУ на РЕН-ТВ. Теперь это редкий мадагаскарский вид, нарушающий законы природы и откладывающий яйца в мешочек на животе

#humor #news

1,421

Нейронавт | Нейросети в творчестве

22 Oct, 08:39

Arch-Guard

От взлома языковых моделей защищаются всерьез.

Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.

Война технологий продолжается

#news #jailbreak

1,045

Нейронавт | Нейросети в творчестве

22 Oct, 07:47

У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой.

И демка которая возможно проживет несколько дней

F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5

Гитхаб
Демо спасибо за наводку @p0lygon

#news #text2image

1,033

Нейронавт | Нейросети в творчестве

21 Oct, 15:03

BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities

Новый гибкий кондиционный генератор картинок.
Кроме генерации умеет распознавать, редактировать.
Инпейнтинг, аутпейнтинг, интерполяция, обогащение (деталями???)

А где же ~~подвох~~ подлох, спросите вы.
А вот он:
Претрейны есть для 512*512 и 256*256

В колабе генерит долго: на блок из 4 картинок 256*256 ушло минуты 3 (третья картинка).

На вход подаются номера классов. Текстовый промпт не предусмотрен.
Ну ладно, может он редактировать хорошо будет?

Код
Колаб

#news #text2image #image2image #inpainting #outpainting #imageediting #image2text

1,171

Нейронавт | Нейросети в творчестве

21 Oct, 13:54

ComfyUI Desktop V1

Отдельное человеческое приложение, не в браузере.
Поддерживаются Windows, macOS, Linux

Будет новый UI, библа моделей, ComfyUI Manager из коробки, прочие плюшки.

Почему будет? Потому что это анонс релиза, а не релиз. Но можно попроситься в бету.

Forge, A1111 - ваш ход?

Записаться в вейтлист

#news #comfyUI

1,165

Нейронавт | Нейросети в творчестве

21 Oct, 11:54

Interactive Character Control with Auto-Regressive Motion Diffusion Models

Диффузная генерация персонажной 3D анимации. Каждая генерация - уникальная анимация.
А еще оно работает в рилтайме.
Ну что, ждем в играх?

Код
Видео от 2-минутного доктора

#humananimation #characteranimation #animatoin #realtime

1,233

Нейронавт | Нейросети в творчестве

21 Oct, 09:38

GStex: Per-Primitive Texturing of 2D Gaussian Splatting for Decoupled Appearance and Geometry Modeling

А теперь про качество текстур для сцен на гауссианах.
GStex прорабатывает текстуры на уровне примитивов.

Код

#gaussian

998

Нейронавт | Нейросети в творчестве

21 Oct, 08:07

Stencil Brush From Sd ControlNet

Плагин к Блендеру для текстурирования на базе SD

#blendeg #plugin #texturing

1,022

Нейронавт | Нейросети в творчестве

21 Oct, 07:39

NotebookLM

Сервис гугла для превращения PDF в подкаст получил новую фичу.

Теперь можно перед созданием проинструктировать подкастеров сосредоточить внимание на конкретных темах или задать уровень экспертизы.

#text2voice #pdf2voice

1,182

Нейронавт | Нейросети в творчестве

21 Oct, 07:00

Tora: Trajectory-oriented Diffusion Transformer for Video Generation

Генерация видео с движением объекта по заданной траектории. Примеры сгенерированы в CogVIdeoX

Код

#text2video #image2video #motioncontrol

743

Нейронавт | Нейросети в творчестве

21 Oct, 06:51

Можно потестить легковесный генератор картинок 1024x1024 Meissonic на демоспейсе

Демо

#text2image

767

Нейронавт | Нейросети в творчестве

20 Oct, 14:07

Обновка от Дениса, автора бесплатного бота @everyone_ai_bot

сделал важное обновление для тех, кто занимается генерацией изображений.
Теперь можно настраивать все параметры-семплер, количество шагов, сид и все остальное для детерминированной генерации. Есть 2 модели Flux. Все также бесплатно.

Также можно создавать вариации и добавил Hires для SDXL моделей.

#text2image #bot

986

Нейронавт | Нейросети в творчестве

20 Oct, 08:48

Робот-манипулятор MAiRA ~~отдает указания жалким людишкам~~ дирижирует Дрезденским симфоническим оркестром.

#news

1,027

Нейронавт | Нейросети в творчестве

19 Oct, 12:14

Мемы есть на злобу дня? а если найду?

#humor

1,165

Нейронавт | Нейросети в творчестве

19 Oct, 10:03

Творческие люди знают, как тяжело бывает начать работу над новым проектом. Мысли о том, что пора бы уже приступить к делу, постоянно откладываются на потом. Знакомо?

Мы предлагаем вам решение этой проблемы — писательский онлайн-коворкинг!

«КомпаниЯ» — это не просто онлайн место, где можно поработать в спокойной обстановке. Это сообщество единомышленников, которые готовы поддержать вас и поделиться своими идеями.

Мы создали дистанционный коворкинг с новой моделью проведения. Графики конференций от 4 часов имеют множество вариаций и созданы с учетом специфики деятельности и психологических особенностей (СДВГ, прогрессирующее проф. выгорание и т.д) с целью повышения личной продуктивности участников.

Есть группы по интересам:
“Рисование и работа с графикой 2д/3д”
“Писательство, публицистика и копирайтинг”
“Программирование, разработка сайтов и приложений”
“Рукоделие, шитье и традиционное рисование”
“Дизайн”
“Учеба”

Что мы предлагаем?
* Ежедневную работу с модераторами и профессиональными психологами.
* Выбор графика от 4 часов в день.
* Возможность работать вместе с другими писателями 6/1.
* Активности, перерывы и медитации для эффективного распределения времени на работу, отдых и творчество.

Не упустите свой шанс стать частью нашего сообщества!

До официального открытия, ты можешь получить доступ более чем к 30 видео встречам в ноябре.

Забирай время с 16:00 до 20:00 всего за 1149 рублей.
(Это в 3 раза дешевле, чем одна часовая консультация психолога!)

Кстати о консультации: ты можешь бесплатно получить анализ твоей проблемы от психолога и помощь с распределением в одну из веток!
Просто оставь заявку на сайте onlinecoworking.ru или пиши старшему администратору @companycoworking!

Ждем будущих звездочек в мире продуктивности! ❤️
Твоя КомпаниЯ.

#промо

Реклама:
ИП Никонова Дарья Дмитриевна
ИНН 526219990067
ОГРНИП 324527500105435
ERID: 2VtzqxHJWou

1,134

Нейронавт | Нейросети в творчестве

19 Oct, 08:13

DepthCrafter ComfyUI

Ноды генератора глубины DepthCrafter

Можете создавать видео с картой глубины на основе любого входного видео

Для рендеринга длинных видео в высоком разрешении (768p и выше) требуется довольно большой объем видеопамяти (>16 ГБ). При меньшем разрешении и более коротких видео будет использоваться меньше видеопамяти. Вы также можете сократить значение context_window для экономии видеопамяти.

Эта модель глубины хорошо сочетается с пакетом Depthflow для создания последовательной анимации глубины

#comfyUI #video2depth

1,125

Нейронавт | Нейросети в творчестве

18 Oct, 15:30

Janus

Мультимодальная модель от DeepSeek.
Текст и картинки.

Модель компактная, основана на DeepSeek-LLM-1.3b-base

Гитхаб
Веса на HF

#VLM #assistant #multimodal #text2image #image2text

1,129

Нейронавт | Нейросети в творчестве

18 Oct, 09:21

VidPanos: Generative Panoramic Videos from Casual Panning Videos

Google DeepMind придумал делать из ваших с рук снятых видео панорамные видео, зацените технологию.

Кода нет

#video2video #paniramicvideo

943

Нейронавт | Нейросети в творчестве

17 Oct, 18:22

ChatGPT (Early Version for Plus, Team, Enterprise, and Edu)

Open AI разродились приложением под Wndows.

Устанавливается из американского Microsoft Store и работает только для платных подписчиков. Мне не показывает даже кнопку установить.
Впрочем ходит слух что для некоторых бесплатных тоже работает. Но я бы на это не рассчитывал.

Установить

#news #assistant

1,167

Нейронавт | Нейросети в творчестве

17 Oct, 14:27

GS^3: Efficient Relighting with Triple Gaussian Splatting

Релайтинг сцен на гауссианах.
На вход набор изображений. На выходе рендер с заданным освещением.

Код

#relighting #gaussian

1,193

Нейронавт | Нейросети в творчестве

17 Oct, 14:03

В Krea.ai прикрутили все наши любимые видеогенераторы. При написании промпта можно выбрать выбрать, в чем продолжить генерацию: Luma, Runway, Kling, Minimax, Pika

#news #image2video

1,454

Нейронавт | Нейросети в творчестве

17 Oct, 12:03

Заскучали по любимым сайтам и приложениям?

Представляем наш совершенный VPN:
✔️быстрый доступ к привычным ресурсам
✔️легкая настройка и никаких переподключений
✔️стабильное и быстрое соединение

Никакой назойливой рекламы, никаких ограничений по трафику

Забирайте бесплатный доступ с нашим промокодом: GreenNeuralRobots

Открытый интернет здесь — @InTechVPN_BOT

#промо

1,046

Нейронавт | Нейросети в творчестве

17 Oct, 10:40

А вот и #ComfyUI для RF-Inversion подвезли

ComfyUI-Fluxtapoz

#styletransfer #personalization

1,070

Нейронавт | Нейросети в творчестве

17 Oct, 10:13

Vision Arena

Лидерборд-арену визуально-языковых моделей не хотите ли?

#vlm #leaderboard #comparison #shootout

995

Нейронавт | Нейросети в творчестве

17 Oct, 08:03

Без лишних слов

Коллега Бурый выкатил свежую подборку лучших нейронок для генерации видео. Всё работает без vpn и прочих плясок.

👉 Ловите

#промо

994

Нейронавт | Нейросети в творчестве

17 Oct, 07:33

D-Edit

Редактор изображений - на основе изображений, текста, масок и удаление элементов. Примеры с сайта кину в комменты

Все это через автоматическую сегментацию - вот и первое неудобство. Если что-то не попало в отдельный сегмент то и редактировать это отдельно мы не сможем. Ну ладно, сегментатор наверно можно прикрутить любой.

В демо кажется реализовано только редактирование текстом. Но редактор в отличие от аналогов учитывает контекст картинки. По крайней мере так заявлено в препринте

Демо

#imageediting #inpainting #image2image

1,002

Нейронавт | Нейросети в творчестве

17 Oct, 05:33

CoTracker3: Simpler and Better Point Tracking by Pseudo-Labelling Real Videos

Трекер группы точек. Наследник CoTracker и ряда других работ и по бенчмаркам лучше их всех.

Код
Демо
Колаб

#tracking #opticalflow

1,028

Нейронавт | Нейросети в творчестве

17 Oct, 05:03

Из прочих новостей

Suno теперь умеет делать музыку из ваших картинок и видео. Но пока только в iOS приложении которое есть только в американском аппсторе

Pika вчера добавила новые эффекты в дополнение к тем которые завирусились на прошлой неделе (мне о них некогда было писать). Сами по себе такие эффекты мне представляются бесполезными, сфера применения очень узкая. Но посмотрим насколько у юзеров хватит выдумки. Видимо, на это и ставка. Как бы то ни было, Pika таким ходом отнишевалась от конкурентов

#news #image2music #video2music #image2video #image2effect

989

Нейронавт | Нейросети в творчестве

greenneuralrobots (Russian)

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве