Нейронавт | Нейросети в творчестве @greenneuralrobots Channel on Telegram

Нейронавт | Нейросети в творчестве

@greenneuralrobots


Канал про нейросети в компьютерной графике, в кино и вообще

для связи @Neuronauticus

greenneuralrobots (Russian)

Нейронавт | Нейросети в творчествеnnКанал greenneuralrobots - это источник вдохновения для всех, кто интересуется нейросетями и их применением в различных областях. Здесь вы найдете увлекательные материалы о нейросетях в компьютерной графике, в кино и в других сферах творчества

Нейросети становятся все более популярными и востребованными в мире искусства и развлечений, и greenneuralrobots поможет вам быть в курсе последних тенденций и практических применений этой удивительной технологии

Если вы хотите узнать о том, как нейросети изменяют процессы создания компьютерной графики, влияют на кинематографию или вдохновляют творческие проекты, то greenneuralrobots - ваш источник информации и вдохновения

Присоединяйтесь к нам, чтобы быть в центре событий и открывать мир нейросетей вместе с нами!
Для связи с нами, обращайтесь к @Neuronauticus.

Нейронавт | Нейросети в творчестве

03 Jan, 15:19


Arnis: Generate any location from the real world in Minecraft

Подгон любителям Майнкрафта. Быстрое автоматическое воссоздание любого реального города в Майнкрафте

#tools #game #mapto3d

Нейронавт | Нейросети в творчестве

03 Jan, 14:47


Gaussian Frosting: Editable Complex Radiance Fields with Real-Time Rendering

Новый метод представления поверхностей с помощью сетки, покрытой слоем гауссиан разной толщины.

Этот слой, называемый "Frosting", позволяет захватывать как сложные объемные эффекты, создаваемые материалами вроде волос или травы, так и плоские поверхности. Модель создается только из RGB-изображений и может быть визуализирована в реальном времени, а также анимирована с использованием традиционных инструментов анимации

🍒Ну и вишенка: есть аддон для блендера

Код
Blender

#blender #gaussian #rendering #realtime

Нейронавт | Нейросети в творчестве

03 Jan, 14:18


MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision

Подгон от Microsoft. Преобразует изображение в меш через карту глубины.

На сравнении выглядит лучше конкурентов, в том числе Depth Anything 2

Код
Демо

#image2depth #video2depth #image2mesh #video2mesh

Нейронавт | Нейросети в творчестве

03 Jan, 13:48


SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Метод генерации видео одновременно с нескольких ракурсов. Демонстрационные видео сделаны в CogvideoX

Код

PS Акелла промахнулся. я про него уже писал

#text2video #multiview #cameracontrol

Нейронавт | Нейросети в творчестве

03 Jan, 13:17


ebook2audiobook v2.0.0 Beta

Конвертер электронных книг в аудиокниги обновился. Поддерживает разные форматы, клонирование голоса, 1124 языка, в том числе русский.

Но мне не понравилась голосовая модель, попозже покажу лучший вариант

Демо

#text2speech #ebook2audiobook #voicecloning

Нейронавт | Нейросети в творчестве

03 Jan, 12:48


PERSE: Personalized 3D Generative Avatars from A Single Portrait

По одному входному портрету PERSE создает анимируемый персонализированный 3D-аватар на гауссианах с независимым редактированием различных атрибутов лица

Код ждем

#humanavatar #portraitanimation #gaussian #facialanimation

Нейронавт | Нейросети в творчестве

03 Jan, 12:18


TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization

Генератор звуковых эффектов. Речь и музыку не вывозит, проверил.

Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды

Код
Демо

#text2audio #text2sfx #foley

Нейронавт | Нейросети в творчестве

03 Jan, 11:21


#humor

Какие-то безумцы релизят свои нейросети даже 1 января. Не дают спокойно посидеть без новостей. Так что выхожу из сумрака

Нейронавт | Нейросети в творчестве

31 Dec, 20:10


Петербурга вам в ленту

Нейронавт | Нейросети в творчестве

31 Dec, 15:28


Расскажите что у вас хорошего произошло в этом году?

Нейронавт | Нейросети в творчестве

31 Dec, 09:30


Новости сегодня уже бесполезно постить))

Этот год был определенно годом видеогенераторов и языковых моделей. Не согласны? Возразите мне в комментах))

Делайте ставки что бустанет в следующем году?

Спасибо всем кто помогал другу другу в комментах, спасибо за ваши репосты и реакции, вы лучшие. Поддержите канал бустами, своим ИИ-творчеством или чем хотите, велком а комментарии

Счастья вам, здоровья и быстрого инференса 🥂

Нейронавт | Нейросети в творчестве

30 Dec, 19:18


DepthLab: From Partial to Complete

инпейнт карт глубины на основе диффузионных моделей.

Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.

Код
Веса

#inpainting #image2depth

Нейронавт | Нейросети в творчестве

30 Dec, 18:58


1.58-bit FLUX

Bytedance и POSTECH квантизовали FLUX [dev].
Квантизованная модель требует для инференса в 5 раз меньше VRAM и занимает на диске в 7.7 раз меньше места.

К сожалению, есть только препринт, а ссылка из препринта ведет на несуществующий сайт. Ждем

#news #optimization #flux

Нейронавт | Нейросети в творчестве

30 Dec, 14:30


Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

Масштабируемый трансформер для быстрой генерации картинок от Yandex Research. Приятно под занавес года увидеть отечественный релиз.

По словам разработчиков, превосходит существующие авторегрессионные (AR) модели и тягается наравне с ведущими диффузными моделями по качеству, при этом обходя их в 7 раз по скорости.

Код
Демо 512
Демо 1024

#text2image

Нейронавт | Нейросети в творчестве

30 Dec, 11:08


Опубликован код генератора 3D сцен на гауссианах по картинке WonderWorld

Код

#gaussian #image2scene #imageto3d

Нейронавт | Нейросети в творчестве

30 Dec, 09:50


OCTAVE (Omni-Capable Text and Voice Engine)

Генератор речи следующего поколения от Hume AI.

Сочетает возможности EVI 2 с возможностями таких систем, как Voice Engine от OpenAI, TTS Voice Design от Elevenlab и NotebookLM от Google Deepmind

OCTAVE может генерировать любой голос и индивидуальность - и сопровождающий язык – по подсказке, имитируя пол, возраст, акцент, вокальный регистр, эмоциональную интонацию, стили речи.

Клонирует голос, акцент и индивидуальность любого говорящего из шумной записи продолжительностью всего в 5 секунд.

Общается голосом в реальном времени. Может создать несколько агентов, общающихся между собой, как в NotebookLM, только в реальном времени.

Сейчас идет тестирование "безопасности" модели кругом избранных, осторожничают

#realtime #text2speech #tts #voicecloning

Нейронавт | Нейросети в творчестве

30 Dec, 09:23


Animate AI

Генератор анимации с консистентными персонажами

записаться в вейтлист

#image2video #text2video #cartoon

Нейронавт | Нейросети в творчестве

28 Dec, 11:45


Aria-UI: Visual Grounding for GUI Instructions

Быстрый легковесный ИИ-агент для выполнения задач на устройстве пользователя через взаимодействие с пользовательским интерфейсом

Код
Демо

#assistant #agent

Нейронавт | Нейросети в творчестве

28 Dec, 11:00


GenWarp: Single Image to Novel Views with Semantic-Preserving Generative Warping

модель генерирует правдоподобные новые ракурсы по одному входному изображению.

Созданные новые ракурсы можно использовать для 3D-реконструкции. В приведенном на видео примере реконструкция 3D-сцены с помощью InstantSplat

Код
Демо

#novelview

Нейронавт | Нейросети в творчестве

28 Dec, 09:46


StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos

Модель для преобразования обычного видео в стерео 3D от Tencent

Может помните времена когда было модно выпускать кино в 3D. И чтобы не заморачиваться на съемках и основном посте, делали стереоконверсию фильма. На это нужны были армии ротоскоперов. А теперь эта задача становится намного дешевле

Код

#stereoconversion

Нейронавт | Нейросети в творчестве

27 Dec, 11:14


Whisk

новый картинкогенератор от Google Labs

Вместо текстовых промптов используем три картинки: одну для субъекта, вторую для сцены, третью для стиля.

Далее Gemini создаёт описания загруженных изображений и передаёт их в Imagen 3

Запаситесь американским IP адресом

#image2image #online

Нейронавт | Нейросети в творчестве

27 Dec, 09:48


DeepSeek V3

Крупнейшая модель в опенсорсе, конкурирует с Sonnet 3.5 и GPT-4o. Превосходит Llama 405B. Особенно хорош в кодинге и математике.

Архитектурно - совет экспертов, рассуждающие модели еще не превзошел

Уже на Чатбот арене

HF
Чат

#assistant #moe

Нейронавт | Нейросети в творчестве

27 Dec, 05:08


OminiControl Training

Опубликован код обучения универсального управляемого генератора изображений OminiControl

Можете обучить свой собственный OminiControl на базе #flux с любым управлением - примерка, 3D, поза или что-либо еще что придумаете.

Только запаситесь двумя NVIDIA H100, 80GB VRAM. Непонятно почему двумя, ведь столько памяти у одной H100, но по ссылке написано именно так

#finetuning #training #conditioning #text2image

Нейронавт | Нейросети в творчестве

26 Dec, 17:37


Звезда фильмов для взрослых Хлоя Амур продала свой облик ИИ-компании чтобы получать отчисления с вебкам-бота не работая

#news #adult

Нейронавт | Нейросети в творчестве

26 Dec, 17:16


Stable Diffusion 3.5 Medium Turbo (SD3.5M Turbo)

Высокопроизводительная дистиллированная версия картинкогенератора #SD35 Medium от Tensorart

Поддерживает лоры

#optimization #text2image

Нейронавт | Нейросети в творчестве

26 Dec, 16:45


SimpleTuner v1.2.2

Обновился инструмент для дообучения диффузных генераторов.

Добавлена поддержка Sana и исправлены баги с обучением SD3.5 (Large + Medium)

реддит

#finetuning

Нейронавт | Нейросети в творчестве

26 Dec, 13:53


УСПЕТЬ ДО НОВОГО ГОДА


Каждый год мы все воодушевленные ставим цели, но потом что-то идет не по плану…

🎁 А ЧТО ЕСЛИ?
Попасть в закрытую тусовку топовых экспертов, подготовиться и стартануть 2025 год с новыми знаниями

А ещё, прокачать свои навыки, окружение и результаты за последнюю неделю уходящего года — абсолютно БЕСПЛАТНО?

Мы с экспертами подумали над этим… и уверенно говорим ПОГНАЛИ!

НО! Просто собрать папку экспертов и сделать канал было бы слишком скучно!

🥁🥁🥁

я представляю тебе…

Новогодний корпоратив экспертов

где каждый день ты будешь читать ценные тосты и узнавать что-то новое и полезное: идеи, бонусы, разборы и шаги для роста!

👥 5 топовых экспертов уже готовы делиться своим опытом и знаниями


🎄 Плюс к этому ты получаешь:

• комьюнити заряженных людей, готовых расти вместе с тобой

• возможность задать любой вопрос экспертам лично

• ежедневные сюрпризы и подарки, которые реально ценны.

короче, это не просто движуха, а настоящий шанс сделать свой рывок и заработать в Новом году

Жми на ссылку, заходи на Корпоратив и забирай свои бонусы 👇🏻

@ExpertPartyBot
@ExpertPartyBot
@ExpertPartyBot

Не упусти свой шанс — впитать самые актуальные связки, идеи, знания и опыт, чтобы сделать заветную сумму 💵

Нейронавт | Нейросети в творчестве

26 Dec, 12:45


HSfM: Reconstructing People, Places, and Cameras

В Беркли придумали новый метод, который совместно реконструирует 3D людей, сцену и камеры из небольшого набора некалиброванных изображений

Посмотреть демо реконструкции
Кода нет

#image2scene #imageto3d #humanreconstruction #camera

Нейронавт | Нейросети в творчестве

26 Dec, 12:15


ltx-video-0.9-vae-finetune

реддитор сделал файнтюн VAE видеогенератора LTX для борьбы с артефактами

Реддит

#finetune #text2video #video2video #image2video

Нейронавт | Нейросети в творчестве

26 Dec, 11:28


3DHM: Synthesizing Moving People with 3D Control

Анимация персонажей в полный рост по одному изображению персонажа и образцу движения.

Новый оживлятор человеков в полный рост

Код ждем

#image2video #humananimation #pose2video

Нейронавт | Нейросети в творчестве

26 Dec, 09:44


Японский метаверс. Now!

Полная копия Токио.
На сайте Пойнт клауды и CityJSON.

Выглядит как полный цифровой близнец, особенно с информацией про автобусы.

Качать и смотреть отсюда:
https://info.tokyo-digitaltwin.metro.tokyo.lg.jp/3dmodel/

Пошуруйте по сайту, интересный

@cgevent

Нейронавт | Нейросети в творчестве

24 Dec, 12:17


Пять лет уж минуло с тех пор как мы были на пике глубокого обучения (нейросетей)

Нейронавт | Нейросети в творчестве

22 Dec, 14:35


Кидайте свежие картинки про роботов и ИИ

#humor

Нейронавт | Нейросети в творчестве

22 Dec, 09:42


Deep Fourier-based Arbitrary-scale Super-resolution for Real-time Rendering

Свежий апскейлер, рилтайм.

Отличительная особенность - повышает разрешение изображения в любое количество раз.

Судя по всему, предназначен для повышения разрешения рендера игровых движков

Код
Видео от двухминутного доктора

#upscale #realtime

Нейронавт | Нейросети в творчестве

22 Dec, 08:51


ComfyUI wrapper nodes for HunyuanVideo

Kijai уже прикрутил улучшайзер видеогенерации Enhance-A-Video в свой #ComfyUI пакет

Спасибо @Skubidoo

#text2video

Нейронавт | Нейросети в творчестве

22 Dec, 07:46


Ну, за мультипликаторов.

Тут Гугль неожиданно выкатил вот такую интересную работу.
И мультик.

Для каждого персонажа свой файнтюн(?!, да, там LoadCheckPoint + Dreambooth SDXL). По 12-то картинкам.

Эти файнтюны генерят кривые руки и пропорции - их корректируют через Depth и Canny контролнеты.
В ComfyUI.

Там же сегментируют персонажей с помощью Dino и SAM.

Часть картинок анимируют с помощью AnimateDiff + DaVinci+Nuke.

А часть - просто ригают и анимируют в Adobe Character Animator.
(Тут мы перестаем пить за мультипликаторов и вопросительно поднимаем бровь). Гугль, это что вообще?

Гугль: это ассистент для аниматоров.

"В рамках этого пилотного проекта мы вместе с художниками разрабатывали новые рабочие процессы для 2D-анимации, одновременно создавая короткометражный образовательный мультфильм. Мы определили несколько рабочих процессов, которые позволят упростить процесс анимации и более эффективно воплотить замыслы художников на экране."

Кода или воркфлоу для Комфи я не нашел.
Но есть кожаные сценарии для эпизодов.

Странная работа.

https://genai-2d-character-animation.github.io/

Нейронавт | Нейросети в творчестве

22 Dec, 06:09


INFP: Audio-Driven Interactive Head Generation in Dyadic Conversations

Bytedance продолжают изобретать способы оживлять картинки

Интерактивная генерация головы на основе звука для диадических (парных) разговоров

Получив две дорожки диалога и одно портретное изображение произвольного агента, INFP динамически синтезирует вербальные, невербальные и интерактивные видео агента с реалистичной мимикой и ритмичными движениями позы головы.

Короче, заставит портрет говорить, петь, человечно слушать

Работает в реальном времени, 40 fps на Nvidia Tesla A10
Применимо например для видеоконференций

Код ждем

#audio2video #talkinghead #image2video #portraitanimation #realtime

Нейронавт | Нейросети в творчестве

21 Dec, 18:28


На праздничный период пользователи тарифа Plus получают «неограниченный» доступ к #Sora в режиме очереди

Кроме того доступ к Sora дали пользователям Teams

#news

Нейронавт | Нейросети в творчестве

21 Dec, 15:59


Одна из задач которую o3 не смогла решить, а вы сможете – 2025 жду с нетерпением, очень интересно где мы будем через год в плане АИ-гонки

Все еще жду AGI к 2027

Нейронавт | Нейросети в творчестве

21 Dec, 14:17


Kling 1.6

Видеогенератор обновился

Работает быстрее, лучше следует запросам и выдаёт более стабильные и качественные результаты

#text2video

Нейронавт | Нейросети в творчестве

21 Dec, 13:46


подписки на ИИ сервисы бесплатно к новому году

1. Luma Dream Machine - Промокод: LUMA-MDMZ (3 месяца)
2. ElevenLabs - Промокод: ODYSSEY11 (1 месяц)
3. Udio - Абуз триала (7 дней)

Как залутать?:
1 - Регистрируемся/входим.
2 - Тыкаем на обновить план.
3.1 - LUMA: тыкаем на месячную Plus подписку
3.2 - ElevenLabs: тыкаем на Starter подписку
3.3 - Udio: там где Standard тыкаем на Trial
4 - Нас перекидывает на страничку оплаты, там мы вводим промокод(для Udio не нужно)
5- Вводим данные сгенерированной карты(см. комментарии к посту), имя владельца от балды, Адресс - хз, но я выбирал штаты, далее адресс от балды, далее город например : Miami, почтовый индекс: 33152, штат сам подтянется, ну а после - подписаться
6 - Поздравляю, у вас халявная подписочка.

P.S Касаемо Udio, после всех вышеописанных действий, этот Trial нужно ещё активировать, активируем в том же окошечке с подписками в окошечке Standard, абузить Udio подобным методом можно сколько угодно, меняете почту, и вперёд.

4. LTX - промокод LTXODYSSEY на Standard план
5. Hedra - промокод HEDRAODYSSEY на базовый план
6. Freepik - 2 месяца бесплатного пользования

7. Leonardo - 5000 кредитов через день, после заполнения анкеты.
8. Viggle - Так же после заполнения анкеты

Стырил у @AINetSD

#халява

Нейронавт | Нейросети в творчестве

21 Dec, 13:16


mage.space

Кстати, тут раздают бесплатный Hunyuan
Надо будет зарегаться и избегать запрещенок всяких, в остальном генерация видео бесплатна

5 секунд видео 360*640 15fps генерится за минуту.
Обещают в будущем сделать HD

#text2video #online

Нейронавт | Нейросети в творчестве

21 Dec, 12:45


Enhance-A-Video: Better Generared Video for Free

Улучшайзер видеогенраторов
Прикручено к Hunyuan и CogvideoX

Код

#text2video

Нейронавт | Нейросети в творчестве

21 Dec, 12:05


1-800-242-8478

Позвонив по этому номеру из США или Канады можно поговорить с ChatGPT.

Полезно например если нет интернета а телефонная связь есть.

Из остальных стран где есть доступ к ChatGPT можно писать на этот номер по ватсапп. Меня игнорит, ну оно и понятно

#assistant #voicechat #news

Нейронавт | Нейросети в творчестве

07 Dec, 11:43


NitroDiffusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training

Генератор картинок.
Принципиально новый подход к диффузной генерации за один шаг с использованием динамической состязательной сети

Есть два чекпойнта: NitroSD-Realism и NitroSD-Vibrant

Репозиторий HF
Демо

Нейронавт | Нейросети в творчестве

07 Dec, 10:34


BRIA 2.3 ControlNet Generative Fill

Быстрый инпейнтинг от BRIA
Предлагают купить API чтобы делать юридически чистые картинки.
Но можно потыкать в демо и скачать веса.
Код на странице модели

Не рисует ни Бендера, ни Пепе

Демо
Веса

#inpainting

Нейронавт | Нейросети в творчестве

07 Dec, 09:19


NVComposer: Boosting Generative Novel View Synthesis with Multiple Sparse and Unposed Images

По одному или нескольким изображениям-ракурсам сцены генерирует новые ракурсы и из них - видео

Черрипик и нечеррипик

Код ждем на днях
Демо

#novelview #cameracontrol #image2video

Нейронавт | Нейросети в творчестве

06 Dec, 10:55


Вниманию пользователей СomfyUI

Пакет Ultralytics, необходимый для FaceDetailer версий v8.3.41 и v8.3.42 был скомпрометирован и содержит майнер. Пока что пострадали только пользователи macOS и Linux. Но чтобы обезопасить себя на Windows, рекомендую удалить любой Ultralytics и поставить версию 8.3.40.
Официальный источник

Как это сделать:
1. Зайдите в корень ComfyUI (там, где лежит папка python_embeded и файл run_nvidia_gpu.bat)
2. В адресной строке проводника (там, где видите путь) нажмите в пустом месте. Выделится путь, сотрите его и наберите cmd и нажимаете ⏎ Enter, чnобы открылась консоль.
3. В открывшейся консоли выполните этот код:
set appdata=tmp
set userprofile=tmp
set temp=tmp
set path=python_embeded
python -m pip uninstall -y ultralytics
python -m pip install ultralytics==8.3.40

Он удалит все пакеты Ultralytics и установит чистые не заражённые, версии 8.3.40

#news

Нейронавт | Нейросети в творчестве

06 Dec, 09:12


Align3R: Aligned Monocular Depth Estimation for Dynamic Videos

Генерирует для видео консистентные глубину, облака точек, камеру

Код
Интерактивная галерея

#video2depth #video2pointcloud #video2camera #tracking

Нейронавт | Нейросети в творчестве

06 Dec, 08:44


Imagine360: Immersive 360 Video Generation from Perspective Anchor

Делает из обычного видео сферичекое панорамное. Для этого, ясно, надо дорисовывать невидимые в исходнике части

Код ждем в январе

#video2panorama #panorama #video2VR

Нейронавт | Нейросети в творчестве

06 Dec, 08:14


One Shot, One Talk: Whole-body Talking Avatar from a Single Image

Реконструкция выразительного говорящего аватара в полный рост по одному изображению. Мимика, жестикуляция, все дела.
Под капотом гибридное представление аватара в виде 3DGS-меша

Код ждем

#humanavatar #humananimation #speech2video #talkinghead #gaussian

Нейронавт | Нейросети в творчестве

06 Dec, 07:47


Director

Думайте о Director как о ChatGPT для видео. Это платформа для создания видеоагентов, которые могут решать сложные видео-задачи, такие как поиск, редактирование, компиляция, генерация и т.д., и мгновенно транслировать результаты.

Код
Попробовать онлайн первые 50 видео - бесплатно

#videoediting #online #text2video #text2audio #text2movie

Нейронавт | Нейросети в творчестве

06 Dec, 07:18


В Anychat продолжают прикручивать всякие ништяки. Из интересного помимо языковых моделей:

- генератор картинок Luma Photon
- генератор видео hunyuan video (вкладка Replicate)
- Flux tools (вкладка Replicate)
- генератор видео ltx video (вкладка fal)
- генератор речи Play.ai

Пользуемся: Anychat

#text2video #video2video #image2video #text2speech #controlnet #conditioning #image2image #text2image #flux

Нейронавт | Нейросети в творчестве

06 Dec, 06:51


MV-Adapter: Multi-view Consistent Image Generation Made Easy

Генерация изображения сразу с нескольких (до 40) ракурсов на базе #SDXL, 768*768

Код
Демо t2i animagine
Демо t2i general
Демо i2i

#multiview #text2image #image2image #text2multiview #image2multiview

Нейронавт | Нейросети в творчестве

05 Dec, 11:39


MultiFoley

Генератор звука по видео от Adobe
Кода нет, ждем в Premiere

#video2sound #video2audio

Нейронавт | Нейросети в творчестве

05 Dec, 08:51


Уже на tost.ai

640x368, 5 секунд

#text2video

Нейронавт | Нейросети в творчестве

05 Dec, 08:15


FLOAT: Generative Motion Latent Flow Matching for Audio-driven Talking Portrait

Оживлятор портретов по звуку речи с контролем эмоций

Код ждем

#talkinghead #speech2video #facialanimation

Нейронавт | Нейросети в творчестве

27 Nov, 07:31


ComfyUI Desktop V1 (beta)

Свершилось. Десктопное приложение наконец выпустили в опенсорс.
Для Windows (NVIDIA) и macOS (серия M)

Гитхаб
Инструкция (в т.ч. по установке)

#comfyUI #news #desktop

Нейронавт | Нейросети в творчестве

26 Nov, 17:00


Sora якобы слили в интернет

Это может оказаться неправдой

Но можно попробовать потыкать демоспейс если повезет

Демо

#news #text2video

Нейронавт | Нейросети в творчестве

26 Nov, 15:38


ControlNets for Stable Diffusion 3.5 Large

Какое совпадение - 2
Вслед за Blackforest Labs, Stability AI выпускают пачку контролнетов к SD 3.5 Large

Blur - апскейлер до 8К и 16К
Canny
Depth

Веса на HF
Гитхаб
Уже в ComfyUI

#conditioning #controlnet #sd35 #text2image #upscale #depth2image

Нейронавт | Нейросети в творчестве

26 Nov, 13:33


Mago Studio

Сервис для стилизации/преобразования видео
от автора Warpfusion &Co
Приятно видеть в команде и другие знакомые лица

Запуск в 2025. Обещают бесплатный локальный запуск базового функционала. Видимо,за счет этого и будут конкурировать со всякими ранвеями

Записаться в бетатестеры

#video2video #styletransfer #stylization

Нейронавт | Нейросети в творчестве

26 Nov, 12:26


Runway Frames

Какое совпадение! У runwayml тоже свой генератор картинок.

Позволяет создавать ни много, ни мало - свои миры, и в них генерить картинки

Думаю, речь о работе со стилями, персонализациями и все такое.
Зайдите на сайт, там много всего

Го тестить (за ваши деньги)!

#text2image #online

Нейронавт | Нейросети в творчестве

26 Nov, 10:47


Kolors Character with Flux

Демоспейс песонализации от команды Kwai Kolors в топе на HF.
Вероятно как-то поженили Kolors с Flux, с первого взгляда непонятно как.
Бендера не смог персонализировать

А также его брат демоспейс
Kolors Portrait with Flux

#personalization #text2image

Нейронавт | Нейросети в творчестве

26 Nov, 10:25


Text-Guided Image Colorization

Колоризация изображений с текстовыми подсказками на базе SDXL/SDXL-Light

Код
Демо

#colorize

Нейронавт | Нейросети в творчестве

26 Nov, 10:04


Fugatto

Новая базовая аудиомодель от Nvidia на 2.5B параметров.
Может если не все, очень много:
звуковые эффекты по текстовому промпту, речь по тексту, музыка, сделать один музыкальный инструмент из другого, добавить музыкальный инструмент в трек, изолировать источник звука из трека.

Попробовать не дают, кода нет

#music #music2music #audioediting #text2sound #text2speech #musicediting

Нейронавт | Нейросети в творчестве

26 Nov, 08:02


Охо-хо-хо! Подарок к новому году🎅

Дарю 50 мест на прохождение курса
“Деньги на Телеграм” — БЕСПЛАТНО! 🎁

Подпишись на канал и забирай курс:
👉https://t.me/+ENN3JvahOBozMDhi

На курсе ты узнаешь:

🎄Как зарабатывать первые 100.000 рублей с нуля
🎄Лучшие инструменты для привлечения клиентов через Телеграм
🎄Как построить автоворонку с помощью искусственного интеллекта
🎄Как превратить фриланс в прибыльный бизнес на 100 тыс, 200 тыс и даже 1 млн рублей!

🔥 Ценность курса — 25.000 рублей, для тебя — БЕСПЛАТНО! 🔥

Ссылка действует только 24 часа!
👉https://t.me/+ENN3JvahOBozMDhi
Новый год — новые цели! Встречай 2025 с навыками, которые принесут свободу и доход!

Успей! Мест всего 50.

#промо

Нейронавт | Нейросети в творчестве

26 Nov, 07:33


Крупное обновление получил видеогенератор Dream Machine
Теперь это рабочая среда, комбайн технологий.
Авторы предлагают начинать творческий процесс с генерации картинок.

Да, у них появился свой картинкогенератор Luma Photon
В картинки можно вносить изменения, делать из них видео. Для видео задавать первый и последний кадр, движение камеры. Удлинять (Extend), задавая конечный кадр.
Brainstorm - генератор идей
И это кажется еще не все

Официальный туториал

#text2image #text2video #image2video #videoediting #imageediting #online #tutorial #cameracontrol #videoextension

Нейронавт | Нейросети в творчестве

20 Nov, 10:01


GeneX: Generative World Explorer

Интересная работа.
Модель обучили ориентироваться в пространстве подобно человеку, учитывая известные объекты вне поля зрения

#news #worldunderstanding

Нейронавт | Нейросети в творчестве

20 Nov, 09:33


JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation

Портретная анимация по звуку речи для людей и животных

Код

#facialanimation #speech2video #image2video #talkinghead

Нейронавт | Нейросети в творчестве

20 Nov, 09:04


AnimateAnything: Consistent and Controllable Animation for video generation

Очередная попытка управлять движением при генерации видео

Код ждем

#cameracontrol #motioncontrol #image2video

Нейронавт | Нейросети в творчестве

20 Nov, 08:25


Anychat

Неплохой подарочек
В этом демоспейсе есть большинство топовых LLM, даже Pixtral Large уже завезли.

Для коммерческих конечно понадобится токен

#assistant #llm

Нейронавт | Нейросети в творчестве

20 Nov, 07:40


Pixtral Large 124B

Mistral AI релизнули зубастую модель и обновили Le Chat. Отличная альтернатива ChatGPT/Claude, да еще и работает без VPN

в чате:

- Веб-поиск

- Canvas - аналог OpenAI Canvas

- Понимание PDF и изображений

- Flux Pro!

Чат

#assistant

Нейронавт | Нейросети в творчестве

19 Nov, 17:38


Suno v4

Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен

#text2music #music2music

Нейронавт | Нейросети в творчестве

19 Nov, 15:39


GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation

Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?

Код ждем
Демо ждем

#textto3d #text2gaussian #gaussian

Нейронавт | Нейросети в творчестве

19 Nov, 13:02


Что не так с LLM?

— API не так дёшевы, как кажется
— Даже большие LLM галлюцинируют
— RAG сходу не работает
— Инференс без оптимизации стоит дорого
— Модели игнорируют инструкции

Про эти и другие проблемы расскажут ребята из DeepSchool на zoom-лекции в четверг. Приходите, чтобы узнать о болячках LLM и как с ними бороться!

А также вы познакомитесь с программой курса LLM, на котором научитесь использовать LLM в приложениях: обучать, деплоить, ускорять и многое другое!

👨‍💻Обо всём этом расскажут:
- Илья Димов — Senior NLP-инженер
- Тимур Фатыхов — ex Lead CV Engineer, основатель DeepSchool

📆 Четверг, 21 ноября, 18:00 МСК.

🎁 После регистрации вы получите список полезных инструментов и библиотек для работы с LLM.

Регистрируйтесь на лекцию по ссылке!

#промо

Нейронавт | Нейросети в творчестве

19 Nov, 10:10


Ultravox

Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!

Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API

Гитхаб
Веса
Демо

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online

Нейронавт | Нейросети в творчестве

19 Nov, 08:20


Говорят, можно обучить лору #flux на нескольких персонажей. Сам не пробовал

Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются

Видео
Реддит

#lora #tutorial

Нейронавт | Нейросети в творчестве

19 Nov, 07:53


SuperSplat 1.9.0

Опенсорсный редактор 3D сцен на гауссианах

Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.

Код
Попробовать онлайн

#gaussian #3Dedit

Нейронавт | Нейросети в творчестве

18 Nov, 08:28


LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

Понимание и генерация 3D сеток языковой моделью.

В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.

Налетаем, пробуем.

Код
Веса
Демо

#textto3d #3dtotext #assistant

Нейронавт | Нейросети в творчестве

18 Nov, 08:13


MagicQuill: An Intelligent Interactive Image Editing System

Редактор картинок с GUI, под капотом #SD 1.5 и мультимодальная LLM

Код
Демо

#imageediting

Нейронавт | Нейросети в творчестве

18 Nov, 07:52


MinerU

Инструмент для преобразования PDF документов в машинно-читаемые форматы (markdown, JSON и т п)

Гитхаб
Демо

#tools #pdf

Нейронавт | Нейросети в творчестве

18 Nov, 07:33


Athene-V2-Agent

Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах

Дообучен из Qwen-2.5-72B-Intruct

#assistant #agent

Нейронавт | Нейросети в творчестве

17 Nov, 11:08


Код RayGauss тоже недавно выложили
Готовьте 24ГБ VRAM для качества как у авторов

Код

#gaussian #rendering #novelview

Нейронавт | Нейросети в творчестве

17 Nov, 11:03


Кстати код гауссиан с релйтингом уже доступен

Код

#relighting #gaussian #novelview

Нейронавт | Нейросети в творчестве

16 Nov, 11:20


Увидел что тут не хватает мема про ИИ или роботов - прояви гражданскую мемную позицию в комментариях

#humor

Нейронавт | Нейросети в творчестве

15 Nov, 14:35


Stable Diffusion 3.5 Prompt Guide

Официальное руководство по написанию промптов для #SD35

#prompting #Guide #tutorial

Нейронавт | Нейросети в творчестве

15 Nov, 08:37


Text Behind Image AI Editor

Хит этой недели. Инструмент для добавления текста за объектом.

И сразу альтернатива на gradio - чуть меньше интерактивности, а по сути то же самое.

Оба инструмента поддерживают русский язык. Затестил обе. Gradio сделал лучше, без кантов

#imageediting #tools

Нейронавт | Нейросети в творчестве

15 Nov, 07:57


ControlNet Union Pro fp8

Квантизованная версия ControlNet Union для Flux.
У нищебродов (меня) будет работать быстрее оригинальной

#flux #controlnet

Нейронавт | Нейросети в творчестве

15 Nov, 07:41


Edify 3D: Scalable High-Quality 3D Asset Generation

Генератор 3D объектов с PBR материалами от NVIDIA. Красиво, но этих рыбов только показывают

Кода нет

#textto3d

Нейронавт | Нейросети в творчестве

14 Nov, 15:23


SD3.5 Large на Amazon

Stable Diffusion 3.5 Large завезли на облачную платформу ИИ-сервисов Amazon SageMaker JumpStart. Теперь можно пилить сервисы на SD35 Large прямо там

#news

Нейронавт | Нейросети в творчестве

14 Nov, 12:53


#neuronaut_art

Нейронавт | Нейросети в творчестве

14 Nov, 11:05


Появился демоспейс кручуна-верчуна картинок DimensionX

Демо

#cameracontrol #image2video

Нейронавт | Нейросети в творчестве

14 Nov, 10:25


RMBG 2.0
BRIA Background Removal v2.0

Обновка крутого удалятора фона RMBG
Потестил в демо - раз на раз не приходится.

Демо

#image2image #backgroundremoval

Нейронавт | Нейросети в творчестве

14 Nov, 10:03


SeedEdit: Align Image Re-Generation to Image Editing

И еще один новый генератор картинок, на этот раз от ByteDance. И не простой, а редактирующий.

Умеет всякое-разное: смена стиля, удаление/замена

Кода нет, опенсорсом не пахнет
Демо с огромной очередью желающих

#text2image #image2image #imageediting

Нейронавт | Нейросети в творчестве

13 Nov, 10:03


Нейросети теперь могут приносить деньги. Но как?

👉🏻 Представьте, что вы делаете посты для тг-канала с помощью ИИ. Причём посты не отличить от написанных человеком.

За пост вам платят 100-200 рублей. В день можно делать 100 постов — за вас их делает нейросеть.

Это один из 30 спосбов заработать на нейросетях.

📌 И вы можете научиться делать такие и другие задачи на нейросетях легко!

Новичку без опыта в такой теме зарабатывает от 15 до 70 тыс рублей в месяц.

Ниша сейчас свободна, много заказов и мало качественных исполнителей.

🟢 Приглашаю на 3х дневный бесплатный марафон, в рамках которого вы:
1️⃣ Разработаете своего нейропомощника
2️⃣ Создадите портфолио для заказов
3️⃣ Научитесь находить заказы

Начало марафона - завтра. В первый же день вы создадите своего первого нейропомощника по простым инструкциям.

▶️ Переходите в закрытый канал, чтобы принять участие. Места ограничены, ссылка на 20 мест → https://t.me/+zjArys0KdmxkZmFi

Реклама.

Нейронавт | Нейросети в творчестве

13 Nov, 09:47


Смотрите что можно делать с DimensionX

#cameracontrol

Нейронавт | Нейросети в творчестве

13 Nov, 09:32


Regional Prompting FLUX

К флюксу прикрутили промптинг по заданным областям. Области задаются сегментными масками

Гитхаб

#flux #text2image

Нейронавт | Нейросети в творчестве

13 Nov, 09:03


ComfyUI RyanOnTheInside

Докатились. Симуляции в #ComfyUI
Партиклы. С реакцией на звук, MIDI, движение, время, цвет, глубину

#particles #dynamics

Нейронавт | Нейросети в творчестве

13 Nov, 08:31


На tost.ai можно крутить DimensionX не только влево

#cameracontrol

Нейронавт | Нейросети в творчестве

13 Nov, 08:00


Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models

Генерация фотореалистичных изображений с пиксельной точностью от Nvidia. Отсутствует CLIP, пиксельное пространство вместо латентного.

Фичи:
- картинки по тексту
- ControlNet-апсемплинг до 4K (генератор выдает 1K)
- поддерживает Controlnet, сети управления
- HDR панорамы 360°
- дообучение, в том числе на несколько объектов

Впечатляет, но

Кода нет

#text2image #panorama #HDR #conditioning #upscale

Нейронавт | Нейросети в творчестве

12 Nov, 17:03


Mochi + FasterCache

Ускоритель видеодиффузии FasterCache прикрутили к Mochi, получив сокращение времени генерации почти вдвое. Обещают gradio демо

твиттер

#optimization #text2image

Нейронавт | Нейросети в творчестве

12 Nov, 16:36


Qwen2.5-Coder-Artifacts

Еще один демоспейс Qwen2.5-Coder
наподобие Claude artifacts

+ Qwen2.5-Coder 32B доступен в Hugging Chat

#coding #assistant

Нейронавт | Нейросети в творчестве

12 Nov, 16:10


e2-f5-tts multilingual

В голосовой модели e2-f5 мультиязычная обновка. Теперь можно клонировать голос и подгружать свои файнтюны, несколько готовых есть. Русского не нашел

Приложение доступно в Pinokio

Инструкция в твиттере

Демо (без файнтюнов)

Гитхаб

#text2speech #tts #voicecloninhg

Нейронавт | Нейросети в творчестве

12 Nov, 12:43


Qwen2.5-Coder

Обновка LLM для работы с кодом Qwen
По бенчмаркам - уровень gpt4o
Опенсорс, доступны 0.5B / 1.5B / 3B / 7B / 14B / 32В. Можно запустить локально

Модели на HF
Демо
Гитхаб

#coding #assistant

Нейронавт | Нейросети в творчестве

12 Nov, 10:35


Обновился генератор видео от Alibaba EasyAnimate до версии v5

Разрешение до 1024x1024, 49 кадров, 8 кадров в секунду, генерация по картинке (финальный кадр тоже можно указать!)
Поддержка #ComfyUI, Lora, Controlnet.
Запаситесь 24 GB VRAM

Демо
ComfyUI
Гитхаб

Веса:
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-InP
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-Control

#text2video #image2video

Нейронавт | Нейросети в творчестве

10 Nov, 15:27


Инфа от посетителя.
В целом интересно побывать на таком мероприятии, хотя ничего нового для тех кто в курсе что видео можно генерировать.

Впечатлил клип на неизданный трек Кирилла Толмацкого aka Дэцл.

Артист ушел из жизни в 2019 году. После чего его отец Александр Толмацкий обнаружил на флешке неизданный трек Кирилла и постарался довести его до финального качества. На этот трек и был создан видеоклип с использованием видеогенераторов участвовавший в конкурсе ИИ фильмов.

Кто знает где посмотреть клип - киньте ссылку, посмотрим вместе

[update] спасибо @lovelettertomyheart

Клип:
https://www.youtube.com/watch?v=F7FO0HRZ2QY

#event

Нейронавт | Нейросети в творчестве

09 Nov, 11:20


Вот и настала чудесная пора, очей очарование.
День мемов. А вы что подумали?

Сдаем мемы про роботов и ИИ на шторы в канал.
Кто не сдаст мем не попадает на общее фото

#humor

Нейронавт | Нейросети в творчестве

09 Nov, 09:16


Исследователи из Neiry и МГУ подключили мозг крысы к искусственному интеллекту.

Для этого они имплантировали инвазивный нейроинтерфейс в мозг животного. Электроды интерфейса стимулируют отдельные зоны мозга.

Интерфейс подключен к языковой модели.
При положительном или отрицательном ответе на вопрос крысе отправляется соответствующий сигнал. В зависимости от места стимуляции крыса испытывает ощущения. На видео видно, как крыса отвечает на разные вопросы и получает вознаграждение за правильные ответы.

#news

Нейронавт | Нейросети в творчестве

08 Nov, 14:27


Loras in Krea

Обучение лор для #Flux (и не только?) на Krea.ai

Сейчас идет запись в вейтлист, но если успеете "в первую сотню" желающих, получите доступ сразу. На странице вейтлиста внизу мелким шрифтом "I have access code". Возможно, появится после подачи заявки. Жмем и вводим пароль:

EARLYBIRD

Записаться в вейтлист

Подсмотрел у Сергея Цыпцына

#lora

Нейронавт | Нейросети в творчестве

08 Nov, 12:39


Learn About

Генератор интерактивных статей и гайдов на любую тему.
Пишем запрос на тему, в которой хотим разобраться - получаем готовую интерактивную статью с введением, основными терминами и актуальностью, ссылками на смежные темы и возможность задавать вопросы, углубляясь в тему.

Я сначала написал запрос на английском, потом в вопросах решил потестить русский. Основная LLM успела в ответ написать мне один абзац на чистом русском, но в ту же секунду цензура заменила его на "Sorry, but I don't speak that language yet." Ага, ага. Не не умеешь, а дискриминируешь 👀

Да, для пользования включайте американский VPN

#assistant #search

Нейронавт | Нейросети в творчестве

08 Nov, 09:55


CogVideoX1.5-5B-SAT

Апгрейд CogVideoX. Генератор видео по тексту и по картинке.

CogVideoX1.5-5B поддерживает 10-секундные видеоролики высокого разрешения (1360 * 768). Пишут что для такого разрешения надо 66ГБ VRAM

CogVideoX1.5-5B-I2V поддерживает любое разрешение (!??). Видимо, речь о разрешении входной картинки

Демки нет. кто умеет - запускаем самостоятельно

#image2video #text2video

Нейронавт | Нейросети в творчестве

08 Nov, 09:31


ReCapture: Generative Video Camera Controls for User-Provided Videos using Masked Video Fine-Tuning

В гугле придумали как добавить в рандомное статичное видео движение камеры. Но нам не рассказали

Кода нет

#video2video #novelview #cameracontrol

Нейронавт | Нейросети в творчестве

08 Nov, 09:05


Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

Генератор глубины по изображению. Хвастаются песпрецедентным качеством и скоростью - 0.3 секунды на 2.25МПикс картинку на потребительском GPU

Код
Веса
Демо

#image2depth

Нейронавт | Нейросети в творчестве

08 Nov, 08:33


X-Portrait 2: Highly Expressive Portrait Animation

То же самое, но круче.
Есть сравнение с Runway Act

Код ждем

#facialanimation #portraitanimation #headanimation #motioncloning #personalization

Нейронавт | Нейросети в творчестве

02 Nov, 15:40


У меня есть скромное мнение что люди которые работают по выходным и выдают контент так же как и по будням - психи.

А может, я просто завидую.
Вот, успел набрюзжать до того как санитары на прогулку забрали

#оффтоп

Нейронавт | Нейросети в творчестве

02 Nov, 11:45


Суббота. Вы знаете что это значит. Сдаем мемовый оброк на околоИИшные темы

#humor

Нейронавт | Нейросети в творчестве

01 Nov, 15:03


HelloMeme: Integrating Spatial Knitting Attentions to Embed High-Level and Fidelity-Rich Conditions in Diffusion Models

Это не генератор мемов, как можно заключить по названию, а очередной опенсорсный инструмент для переноса портретной анимации.

Работает ли оно только на SD1.5 (с лорами, кстати) или с более новыми генераторами картинок тоже - непонятно

Обратите внимание на заявленное превосходство над Liveportrait

Код

#pose2video #facialanimation #portrait2video #personalization

Нейронавт | Нейросети в творчестве

01 Nov, 13:18


У Meta AI тоже обновка

ИИ-функции теперь интегрированы в инстаграм, фейсбук, ватсапп (продукты, запрещенной в РФ Мета)

Камерун - да. Россия - нет 🤩

#news

Нейронавт | Нейросети в творчестве

01 Nov, 12:50


Suno Personas

В генераторе музыки Suno появилась возможность создавать собственных исполнителей — Personas.

Принцип работы прост: выбираете Suno-трек с понравившимся голосом, нажимаете кнопку Make Persona, и последующие треки можете генерить с этим голосом

Бета доступна подписчикам Pro и Premier. На старте дают сгенерировать 200 треков, далее платно по 10 кредитов за трек

#text2music #music2music #news

Нейронавт | Нейросети в творчестве

01 Nov, 12:37


Bolt.new

Пишем какое нужно приложение — Болт создаёт полноценный веб-сервис (фронтенд, бэкенд) весьма шустро.
Приложение работает в песочнице для проверки и редактирования кода.
Развёртывается публично в интернете одним нажатием кнопки.
20 тысяч токенов в день бесплатно, 10 миллионов токенов в месяц за 20$.

#coding

Нейронавт | Нейросети в творчестве

01 Nov, 11:34


Cursor

ИИ-редактор кода на основе VS Code. Несколько провадеров LLM на выбор.
Есть бесплатный тариф

#coding

Нейронавт | Нейросети в творчестве

01 Nov, 05:45


AMA with OpenAI’s Sam Altman, Kevin Weil, Srinivas Narayanan, and Mark Chen

Вчера на реддите Сэм Альтман с группой товарищей провели сессию ответов на вопросы юзеров. Огромный тред, есть герои почитать?

#news

Нейронавт | Нейросети в творчестве

01 Nov, 05:23


ChatGPT search

ChatGPT научили гуглить (вероятно, этот термин в ближайшем будущем заменят на что-то другое)

Платным подписчикам и тем кто попал в вейтлист - уже. Бесплатным пользователям - в ближайшие месяцы.

#search #nws #assistant

Нейронавт | Нейросети в творчестве

01 Nov, 05:03


3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes

Очередная бомбическая работа от NVIDIA.
Поженили гауссианы с рейтрейсером.
За счет этого можно в сцену добавлять объекты, отрабатывают тени, отражения, преломление, глубина резкости. Можно наруливать материалы, и они будут работать.

Работает довольно шустро - 78 кадров в секунду на датасете MipNeRF360 на NVIDIA RTX 6000 Ada

Есть только препринт, кода нет. Вопрос куда это прикрутят? Вернее, когда

#rendering #gaussian #material #news

Нейронавт | Нейросети в творчестве

31 Oct, 19:46


Blendbox

Blockadelabs, известные нам генератором объемных панорам, выпустили свой нейроредактор изображений.

Здесь есть слои и "рилтаймовый" холст, напоминающий Krea.ai

Все это добро, видимо, платное. Попробовать бесплатно мне не удалось

#text2image #image2image #realtime #imageediting

Нейронавт | Нейросети в творчестве

31 Oct, 17:04


UDIO Edit

В генераторе музыки обновка инпейнтинга

Легкая замена любого кусочка музыки или слов

Выбираем трек. Жмем Edit, а затем Replace Section или Edit Lyric.

Функция доступна в десктопных браузерах и только для платных подписчиков

#inpainting #musicediting

Нейронавт | Нейросети в творчестве

31 Oct, 16:34


Claude for Desktop Beta

Официальное приложение Claude с Sonnet 3.6 под #Windows / #MacOS

Ссылки я для вас достал через VPN, дальше сами

Win
Win (arm64)
macOS

#desktop #assistant

Нейронавт | Нейросети в творчестве

31 Oct, 07:02


Дизайн интерьера с нейросетями: ускорь процессы и увеличь доход!

Ты можешь делегировать нейросети:
создание концепций, дизайн и визуализацию
контент план и развитие личного бренда
маркетинг и бизнес процессы

Где взять инфу?

Подпишись на канал эксперта, который уже создал более 100 интерьеров с помощью ИИ в России и на Бали. Все секреты дизайна с использованием нейросетей здесь👇

🎁А в закрепе тебя ждут уроки и гайды по нейросетям, которые подойдут как новичкам, опытным профессионалам, так и предпринимателям!
Подписывайся и смотри👇

https://t.me/+BkzviAJvVY81ODcy

Бесплатно для первых 50 человек⚠️

#промо

Нейронавт | Нейросети в творчестве

27 Oct, 17:34


У нас в чате Константин принимает запросы на тест дубляжа по лицам от Runway

https://t.me/greenrobotschat/16028

Нейронавт | Нейросети в творчестве

27 Oct, 15:19


IC-Light V2

Вторая версия релайтера, на базе Flux
Умеет корректно работать со стилизованными изображениями, нативное высокое разрешение

Код ждем
Демо пробуем

#relighting

Нейронавт | Нейросети в творчестве

26 Oct, 11:16


База от Fiverr (биржи фрилансеров)

#humor

Нейронавт | Нейросети в творчестве

26 Oct, 08:37


Всем кто не ставил лайки на этой неделе, назначаем штраф мемами

#humor

Нейронавт | Нейросети в творчестве

25 Oct, 16:49


Опубликован код аватара на гауссианах DreamWaltz-G

Код

#text2avatar #text2gaussian #humanavatar

Нейронавт | Нейросети в творчестве

25 Oct, 16:17


Framer: Interactive Frame Interpolation

Интерполяция кадров с контролем траектории.
Кажется, пора уже вводить термин креативная интерполяция кадров

Код ждем 28 октября
Демо ждем

#frameinterpolation #slowmotion #motioncontrol

Нейронавт | Нейросети в творчестве

25 Oct, 15:47


Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs

Ну и оказывается, у Apple есть чем крыть.
Понималка мобильных интерфейсов.

Есть только препринт

#screen2text #agent #assistant

Нейронавт | Нейросети в творчестве

25 Oct, 14:55


OmniParser: Screen Parsing tool for Pure Vision Based GUI Agent

Познакомьтесь с OmniParser — компактным модулем анализа экрана, который может преобразовывать скриншоты пользовательского интерфейса в структурированные элементы. OmniParser можно использовать с различными моделями для создания агентов, способных выполнять действия в пользовательских интерфейсах. При использовании с GPT-4V он значительно повышает способность агента генерировать точные действия для областей интерфейса.

Иначе говоря, OmniParser+GPT-4V = конкурент Claude Computer Use

Код

#screen2text #agent #assistant

Нейронавт | Нейросети в творчестве

25 Oct, 14:23


KlingAI Virtual Try-On

Если вам не хватало виртуальных примерочных то вот еще одна, на API клинга

Код

#image2image

Нейронавт | Нейросети в творчестве

25 Oct, 13:55


Computer Use - OOTB

Уже слышали про Claude Computer Use?
Приложение-агент от Anthropic для автоматизации любых задач на локальном компьютере?

Вот вам способ установки без докера. Бонусом - удаленное управление компом с мобилки.

Код

Альтернатива: agent.exe

#assistant #agent #tools

Нейронавт | Нейросети в творчестве

25 Oct, 13:34


MFLUX-WEBUI

Для вас, маководы
GUI для работы с #Flux
Контролнет, интерграция с Civitai и прочие свистоперделки в комплекте

Есть в Pinokio

Гитхаб

#tools #mac

Нейронавт | Нейросети в творчестве

25 Oct, 13:08


VistaDream: Sampling multiview consistent images for single-view scene reconstruction

Дерзко. Создает 3D сцену на гауссианах из одной картинки

Код
Галерея

#gaussian #image2scene #imageto3d #image2gaussian

Нейронавт | Нейросети в творчестве

25 Oct, 13:01


Flux.1 Lite alfa

альфа-версия Flux.1 Lite от Freepik с 8B параметров, дистилированной из FLUX.1-dev (а dev, напоминаю - дистилированная из pro). Эта версия использует на 7 ГБ меньше оперативной памяти и работает на 23% быстрее при сохранении той же точности (bfloat16), что и оригинальная модель.

Репозиторий на HF

#flux #text2image

Нейронавт | Нейросети в творчестве

25 Oct, 12:46


SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree

Улучшенный SAM2 для сегментации длинных видео

Код

#segmentation #video2mask

Нейронавт | Нейросети в творчестве

25 Oct, 12:27


IntraPaint

Редактор картинок на базе Forge/A1111 (запускать с ключом --api). В будущем - и на ComfyUI

Гитхаб
Видео

#tools #imageediting #text2image #image2image #inpainting

Нейронавт | Нейросети в творчестве

23 Oct, 05:03


JoyCaption Alpha 2 - Batch Script

Скрипт для пакетной обработки картинок в JoyCaption.

Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии

Реддит

#image2text #captioning

Нейронавт | Нейросети в творчестве

22 Oct, 19:02


Mochi 1

Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)

Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)

#text2video

Нейронавт | Нейросети в творчестве

22 Oct, 15:54


Итак, кастомизация SD3.5

Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM

Официальный гайд

готовые лоры:
раз
два
три
———————————
Примеры ComfyUI

———————————
SD3.5-fp8 (пожатая модель)

Спионерил у @SergeyTsyptsyn

#lora #text2image #comfyui #finetuning

Нейронавт | Нейросети в творчестве

22 Oct, 14:28


Stable Diffusion 3.5

Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.

Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября

Уже поддерживается в ComfyUI

Модель HF
Гитхаб

Демо HF
API
Replicate

#text2image #news

Нейронавт | Нейросети в творчестве

22 Oct, 11:33


Короче, код Sana собираются опубликовать. Как стало ясно из комментария на гитхабе, ждут внутреннего одобрения

#news

Нейронавт | Нейросети в творчестве

22 Oct, 08:55


Мемная нейроптица с огромными тестикулами залетела к профессору МГУ на РЕН-ТВ. Теперь это редкий мадагаскарский вид, нарушающий законы природы и откладывающий яйца в мешочек на животе

#humor #news

Нейронавт | Нейросети в творчестве

22 Oct, 08:39


Arch-Guard

От взлома языковых моделей защищаются всерьез.

Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.

Война технологий продолжается

#news #jailbreak

Нейронавт | Нейросети в творчестве

22 Oct, 07:47


У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой.

И демка которая возможно проживет несколько дней

F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5

Гитхаб
Демо спасибо за наводку @p0lygon

#news #text2image

Нейронавт | Нейросети в творчестве

21 Oct, 15:03


BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities

Новый гибкий кондиционный генератор картинок.
Кроме генерации умеет распознавать, редактировать.
Инпейнтинг, аутпейнтинг, интерполяция, обогащение (деталями???)

А где же подвох подлох, спросите вы.
А вот он:
Претрейны есть для 512*512 и 256*256

В колабе генерит долго: на блок из 4 картинок 256*256 ушло минуты 3 (третья картинка).

На вход подаются номера классов. Текстовый промпт не предусмотрен.
Ну ладно, может он редактировать хорошо будет?

Код
Колаб

#news #text2image #image2image #inpainting #outpainting #imageediting #image2text

Нейронавт | Нейросети в творчестве

21 Oct, 13:54


ComfyUI Desktop V1

Отдельное человеческое приложение, не в браузере.
Поддерживаются Windows, macOS, Linux

Будет новый UI, библа моделей, ComfyUI Manager из коробки, прочие плюшки.

Почему будет? Потому что это анонс релиза, а не релиз. Но можно попроситься в бету.

Forge, A1111 - ваш ход?

Записаться в вейтлист

#news #comfyUI

Нейронавт | Нейросети в творчестве

21 Oct, 11:54


Interactive Character Control with Auto-Regressive Motion Diffusion Models

Диффузная генерация персонажной 3D анимации. Каждая генерация - уникальная анимация.
А еще оно работает в рилтайме.
Ну что, ждем в играх?

Код
Видео от 2-минутного доктора

#humananimation #characteranimation #animatoin #realtime

Нейронавт | Нейросети в творчестве

21 Oct, 09:38


GStex: Per-Primitive Texturing of 2D Gaussian Splatting for Decoupled Appearance and Geometry Modeling

А теперь про качество текстур для сцен на гауссианах.
GStex прорабатывает текстуры на уровне примитивов.

Код

#gaussian

Нейронавт | Нейросети в творчестве

21 Oct, 08:07


Stencil Brush From Sd ControlNet

Плагин к Блендеру для текстурирования на базе SD

#blendeg #plugin #texturing

Нейронавт | Нейросети в творчестве

21 Oct, 07:39


NotebookLM

Сервис гугла для превращения PDF в подкаст получил новую фичу.

Теперь можно перед созданием проинструктировать подкастеров сосредоточить внимание на конкретных темах или задать уровень экспертизы.

#text2voice #pdf2voice

Нейронавт | Нейросети в творчестве

21 Oct, 07:00


Tora: Trajectory-oriented Diffusion Transformer for Video Generation

Генерация видео с движением объекта по заданной траектории. Примеры сгенерированы в CogVIdeoX

Код

#text2video #image2video #motioncontrol

Нейронавт | Нейросети в творчестве

21 Oct, 06:51


Можно потестить легковесный генератор картинок 1024x1024 Meissonic на демоспейсе

Демо

#text2image

Нейронавт | Нейросети в творчестве

20 Oct, 14:07


Обновка от Дениса, автора бесплатного бота @everyone_ai_bot

сделал важное обновление для тех, кто занимается генерацией изображений.
Теперь можно настраивать все параметры-семплер, количество шагов, сид и все остальное для детерминированной генерации. Есть 2 модели Flux. Все также бесплатно.

Также можно создавать вариации и добавил Hires для SDXL моделей.

#text2image #bot

Нейронавт | Нейросети в творчестве

20 Oct, 08:48


Робот-манипулятор MAiRA отдает указания жалким людишкам дирижирует Дрезденским симфоническим оркестром.

#news

Нейронавт | Нейросети в творчестве

19 Oct, 12:14


Мемы есть на злобу дня? а если найду?

#humor

Нейронавт | Нейросети в творчестве

19 Oct, 10:03


Творческие люди знают, как тяжело бывает начать работу над новым проектом. Мысли о том, что пора бы уже приступить к делу, постоянно откладываются на потом. Знакомо?

Мы предлагаем вам решение этой проблемы — писательский онлайн-коворкинг!

«КомпаниЯ» — это не просто онлайн место, где можно поработать в спокойной обстановке. Это сообщество единомышленников, которые готовы поддержать вас и поделиться своими идеями.

Мы создали дистанционный коворкинг с новой моделью проведения. Графики конференций от 4 часов имеют множество вариаций и созданы с учетом специфики деятельности и психологических особенностей (СДВГ, прогрессирующее проф. выгорание и т.д) с целью повышения личной продуктивности участников.

Есть группы по интересам:
“Рисование и работа с графикой 2д/3д”
“Писательство, публицистика и копирайтинг”
“Программирование, разработка сайтов и приложений”
“Рукоделие, шитье и традиционное рисование”
“Дизайн”
“Учеба”

Что мы предлагаем?
* Ежедневную работу с модераторами и профессиональными психологами.
* Выбор графика от 4 часов в день.
* Возможность работать вместе с другими писателями 6/1.
* Активности, перерывы и медитации для эффективного распределения времени на работу, отдых и творчество.

Не упустите свой шанс стать частью нашего сообщества!

До официального открытия, ты можешь получить доступ более чем к 30 видео встречам в ноябре.

Забирай время с 16:00 до 20:00 всего за 1149 рублей.
(Это в 3 раза дешевле, чем одна часовая консультация психолога!)

Кстати о консультации: ты можешь бесплатно получить анализ твоей проблемы от психолога и помощь с распределением в одну из веток!
Просто оставь заявку на сайте onlinecoworking.ru или пиши старшему администратору @companycoworking!

Ждем будущих звездочек в мире продуктивности! ❤️
Твоя КомпаниЯ.

#промо

Реклама:
ИП Никонова Дарья Дмитриевна
ИНН 526219990067
ОГРНИП 324527500105435
ERID: 2VtzqxHJWou

Нейронавт | Нейросети в творчестве

19 Oct, 08:13


DepthCrafter ComfyUI

Ноды генератора глубины DepthCrafter

Можете создавать видео с картой глубины на основе любого входного видео

Для рендеринга длинных видео в высоком разрешении (768p и выше) требуется довольно большой объем видеопамяти (>16 ГБ). При меньшем разрешении и более коротких видео будет использоваться меньше видеопамяти. Вы также можете сократить значение context_window для экономии видеопамяти.

Эта модель глубины хорошо сочетается с пакетом Depthflow для создания последовательной анимации глубины

#comfyUI #video2depth

Нейронавт | Нейросети в творчестве

18 Oct, 15:30


Janus

Мультимодальная модель от DeepSeek.
Текст и картинки.

Модель компактная, основана на DeepSeek-LLM-1.3b-base

Гитхаб
Веса на HF

#VLM #assistant #multimodal #text2image #image2text

Нейронавт | Нейросети в творчестве

18 Oct, 09:21


VidPanos: Generative Panoramic Videos from Casual Panning Videos

Google DeepMind придумал делать из ваших с рук снятых видео панорамные видео, зацените технологию.

Кода нет

#video2video #paniramicvideo

Нейронавт | Нейросети в творчестве

17 Oct, 18:22


ChatGPT (Early Version for Plus, Team, Enterprise, and Edu)

Open AI разродились приложением под Wndows.

Устанавливается из американского Microsoft Store и работает только для платных подписчиков. Мне не показывает даже кнопку установить.
Впрочем ходит слух что для некоторых бесплатных тоже работает. Но я бы на это не рассчитывал.

Установить

#news #assistant

Нейронавт | Нейросети в творчестве

17 Oct, 14:27


GS^3: Efficient Relighting with Triple Gaussian Splatting

Релайтинг сцен на гауссианах.
На вход набор изображений. На выходе рендер с заданным освещением.

Код

#relighting #gaussian

Нейронавт | Нейросети в творчестве

17 Oct, 14:03


В Krea.ai прикрутили все наши любимые видеогенераторы. При написании промпта можно выбрать выбрать, в чем продолжить генерацию: Luma, Runway, Kling, Minimax, Pika

#news #image2video

Нейронавт | Нейросети в творчестве

17 Oct, 12:03


Заскучали по любимым сайтам и приложениям?

Представляем наш совершенный VPN:
✔️быстрый доступ к привычным ресурсам
✔️легкая настройка и никаких переподключений
✔️стабильное и быстрое соединение

Никакой назойливой рекламы, никаких ограничений по трафику

Забирайте бесплатный доступ с нашим промокодом: GreenNeuralRobots

Открытый интернет здесь @InTechVPN_BOT

#промо

Нейронавт | Нейросети в творчестве

17 Oct, 10:40


А вот и #ComfyUI для RF-Inversion подвезли

ComfyUI-Fluxtapoz

#styletransfer #personalization

Нейронавт | Нейросети в творчестве

17 Oct, 10:13


Vision Arena

Лидерборд-арену визуально-языковых моделей не хотите ли?

#vlm #leaderboard #comparison #shootout

Нейронавт | Нейросети в творчестве

17 Oct, 08:03


Без лишних слов

Коллега Бурый выкатил свежую подборку лучших нейронок для генерации видео. Всё работает без vpn и прочих плясок.

👉 Ловите

#промо

Нейронавт | Нейросети в творчестве

17 Oct, 07:33


D-Edit

Редактор изображений - на основе изображений, текста, масок и удаление элементов. Примеры с сайта кину в комменты

Все это через автоматическую сегментацию - вот и первое неудобство. Если что-то не попало в отдельный сегмент то и редактировать это отдельно мы не сможем. Ну ладно, сегментатор наверно можно прикрутить любой.

В демо кажется реализовано только редактирование текстом. Но редактор в отличие от аналогов учитывает контекст картинки. По крайней мере так заявлено в препринте

Демо

#imageediting #inpainting #image2image

Нейронавт | Нейросети в творчестве

17 Oct, 05:33


CoTracker3: Simpler and Better Point Tracking by Pseudo-Labelling Real Videos

Трекер группы точек. Наследник CoTracker и ряда других работ и по бенчмаркам лучше их всех.

Код
Демо
Колаб

#tracking #opticalflow

Нейронавт | Нейросети в творчестве

17 Oct, 05:03


Из прочих новостей

Suno теперь умеет делать музыку из ваших картинок и видео. Но пока только в iOS приложении которое есть только в американском аппсторе

Pika вчера добавила новые эффекты в дополнение к тем которые завирусились на прошлой неделе (мне о них некогда было писать). Сами по себе такие эффекты мне представляются бесполезными, сфера применения очень узкая. Но посмотрим насколько у юзеров хватит выдумки. Видимо, на это и ставка. Как бы то ни было, Pika таким ходом отнишевалась от конкурентов

#news #image2music #video2music #image2video #image2effect