Долина Ботов @botvalley_expedition Channel on Telegram

Долина Ботов

@botvalley_expedition


Разработка ботов любой степени извращенности

Долина Ботов (Russian)

Долина Ботов - это удивительное место, где развивается и процветает искусство создания ботов. На канале Telegram под названием @botvalley_expedition вы сможете погрузиться в мир разработки ботов любой степени извращенности. Кто же находится в глубинах этой Долины Ботов? Это талантливые разработчики, которые не боятся экспериментировать и придумывать уникальные и оригинальные боты. С их помощью, вы сможете улучшить свой опыт использования Telegram и других платформ, где боты могут быть полезными помощниками. Что такое @botvalley_expedition? Это исследовательская экспедиция в мир ботов, где каждый найдет что-то интересное и полезное для себя. Здесь вы сможете узнать о самых последних трендах в разработке ботов, поделиться своими идеями и наработками, а также найти вдохновение для создания собственного бота. Не упустите возможность стать частью уникального сообщества, где ценится творчество, инновации и страсть к технологиям. Присоединяйтесь к Долине Ботов и откройте для себя мир бесконечных возможностей в создании и использовании ботов!

Долина Ботов

17 Jan, 11:24


Unitree улучшили маневренность своего гуманоида G1 Bionic.

Компания почти каждый месяц радует обновами, на этот раз они наделили своего робота плавной ходьбой и бегом. Реакция прохожих говорит сама за себя)

Долина Ботов

26 Dec, 12:18


Tesla показали будущее беспилотного транспорта — Cybercab.

Внутри нет руля и водительского места, а всё пространство предназначено исключительно для пассажиров. Уникальная фишка: управлять автомобилем можно с геймпада (как проводного, так и беспроводного) или через Wi-Fi.

Первый тестовый заезд уже состоялся, и, судя по всему, технология работает. Массовое внедрение сервиса планируется на 2027 год.

Зачем это нужно? Отсутствие физического управления — шаг к полной автономии и отказу от человеческого фактора. Плюс это прямой сигнал для рынка, что Tesla не просто разрабатывает технологию, но и может менять восприятие транспорта как такового.

Идея амбициозная, но под вопросом остается безопасность и взаимодействие с инфраструктурой. Реально ли геймпад и Wi-Fi как управление для автономного транспорта? Пока это выглядит больше как эксперимент, чем готовое решение.

Долина Ботов

25 Dec, 19:34


Провели очень красивую фотосессию Олегу Торбосову, 😻приятно работать с такими топовыми предпринимателями 🤗

Тут пополняем наше портфолио:
ФОТОСТУДИЯ

Долина Ботов

25 Dec, 17:37


RenderNet превратился в генератор музыкальных клипов.

Новая функция позволяет быстро и просто создать клип, даже если это ваш первый эксперимент. Ловите инструкцию:

— Заходим на сайт и жмем Create Now (в самом верху, напротив "New Feature Alert" и "Stunning Music Videos of Your Characters!";
— Загружаем аудио для клипа. Файл не должен превышать 50 мб, а длительность — до 5 минут;
— Из загруженного аудио выделяем фрагмент, для которого делаем клип, его максимальная длительность — 1 минута;
— На выбор представлены 9 ИИ-аватаров, которые сыграют роль главного исполнителя в клипа, выбираем кто больше нравится;
— Пишем промпт: указываем стиль и другие пожелания.

Увы, потестить бесплатно не дают, нужна платная подписка, которая стартует от $5/мес (только для некоммерческого использования), а в подписке от $14/мес коммерческое использование уже разрешено.

Долина Ботов

24 Dec, 14:57


Скоро всех курьеров уволят, и их места займут роботы. Уже через год сквозь огонь, воду и медные трубы вот такой робопес привезет вам пиццу.

Долина Ботов

23 Dec, 17:34


CabinaAI обзавелась нейрофотошопом.

Cabina выпустили удобный инструмент для работы с изображениями на базе нейросетей, который умеет:

• Удалять фон — это уже стандартная фича, но зато быстрая и точная.
• Легко исправлять или добавлять детали с помощью кисти.
• Расширять границы — ещё больше пространства для идей.
• Заменять один объект на другой по текстовой подсказке.

Есть бесплатный режим, но для полноценной работы советую приобрести подписку, стартует от $5.

Долина Ботов

23 Dec, 15:19


o3 от OpenAI оказалась одним из лучших программистов на планете.

Как вы помните, OpenAI недавно представили новую модель o3, и она буквально ворвалась в топ мирового рейтинга Codeforces — крупнейшей платформы спортивного программирования.

Немного безумных фактов:
— Рейтинг o3: 2727, а это соответствует 175 месту в мире.
— Результат соответствует званию международного гроссмейстера (гроссмейстеров всего чуть более 300 человек).
— Для сравнения, лидеры рейтинга — профессионалы с многолетним опытом и победители мировых олимпиад.

Codeforces — это не просто сайт, а сообщество из десятков тысяч программистов, где ранги распределяются от новичков (до 1200 баллов) до легендарных гроссмейстеров (от 3000 баллов).

Старший вице-президент по исследованиям OpenAI Марк Чен отмечал, что его личный рейтинг около 2500. Лидер платформы Геннадий Короткевич имеет 3985 баллов — недостижимую высоту для большинства людей.

Вот так o3 доказала, что искусственный интеллект может не просто решать задачи, но и соревноваться на ур...

Долина Ботов

21 Dec, 05:44


OpenAI показали новые модели о3 и о3-mini.

Что ж, вот и финальная презентация от OpenAI и сразу 2 модели. о3 уже показывает безумные результаты в кодинге и других тестах, а в тесте на AGI обходит людей (но ещё не AGI). И вроде пора собираться на завод, но есть нюанс.

Что известно:

• Кодинг: на Codeforces о3 достигла рейтинга 2727, а это даже лучше, чем у инженера OpenAI. Фактически о3 пишет код на 30% эффективнее предыдущих версий.
• Математика: в тесте AIME 2024 о3 набрала 96,7%, пропустив всего одну задачу. Для сравнения, это уровень 2,5% лучших студентов-математиков США.
• Обучение: в бенчмарке ARC (тест потенциального AGI) модель достигла 87,5%. Предыдущий рекорд был 50%, а среднестатистический человек набирает около 85%.

Нюансы:

• Затраты на вычисления пока слишком высокие. Решение одной сложной задачи в режиме максимальной точности стоит ~$17-20.
• Хотя о3 близка к AGI по ряду параметров, это всё ещё не полноценный общий искусственный интеллект.

Сейчас модель проходит тестирование на безопаснос...

Долина Ботов

14 Dec, 12:01


Некоторые пользователи уже получили доступ к «видящему» ChatGPT и делятся результатами первых тестов.

А как бы вы использовали эту фичу?

Долина Ботов

14 Dec, 10:16


Вышла обновлённая модель Pika 2.0.

Что нового:

• Функция Scene Ingredients. Теперь можно загружать свои изображения – персонажей, предметы, декорации и описывать сцену промптом. ИИ автоматически определит роль каждого элемента и объединит их в одну сцену.

• Визуальные эффекты вышли на новый уровень, особенно в контексте управления деталями и последовательностью.

• Также обещают хорошее выравнивание текста, что бы это ни значило.

Демка красивая, но бесплатно потестить не дают. А еще у них водяной знак даже на платных тарифах. Чтобы его убрать, нужен максимальный тариф Fancy (76$/мес). Потестить можно тут.

Долина Ботов

13 Dec, 21:22


В ChatGPT завезли «Проекты» — больше никакого хаоса.

Мы дождались: теперь можно объединять чаты, файлы и инструкции в одном проекте. Особенно обновление оценят те, кто работает с объёмными задачами в ChatGPT, будь то разработка, аналитика или создание контента.

Как это работает:

• Все материалы в одном проекте — добавляете код, документы, графики, выгрузки из чатов — всё, что нужно.
• Чат адаптируется — задаёте кастомные инструкции под каждый проект, чтобы ChatGPT сразу понимал, что от него хотят.
• Контекст на лету — бот запоминает всё, что загружено, и отвечает на вопросы, исходя из этих данных.
• Для разработчиков это буквально папки, которые раньше приходилось держать где-то отдельно. Например, весь код и документацию для приложения теперь можно хранить в одном проекте и работать в едином пространстве.

Главное, что «Проекты» убирают хаос и позволяют сосредоточиться на решении задач, а не на поиске нужной информации среди кучи чатов.

Платным подписчикам уже доступны «Проекты», а у вех остальных поя...

Долина Ботов

13 Dec, 13:30


Krea AI открыли доступ к своему редактору изображений на базе ИИ.

Бесплатно и прямо в браузере можно:
✔️ Расширять границы изображений.
✔️ Заменять, добавлять или удалять объекты на фото по промпту.
✔️ Генерировать новые области изображения или отдельные фрагменты.
✔️ Перемещать элементы внутри кадра.

Интерфейс интуитивно понятный, а результаты выглядят натурально: тени, перспективы и общая стилистика картинки сохраняются.

Если вам нужен аналог Photoshop с ИИ-фичами — вперед тестировать.

Долина Ботов

13 Dec, 11:36


Ищем клиентского менеджера по заявкам для нейро-фотосессий

Привет! У нас бум заявок на услугу нейро-фотосессий. Уже больше 30 заявок в день, и мы ищем человека, который поможет обрабатывать их быстро и качественно.

Что нужно делать:
— Обрабатывать входящие заявки в Telegram.
— Общаться с клиентами: отвечать на вопросы, помогать оформить заказ.
— Следить, чтобы всё шло гладко и без задержек.

Кого мы ищем:
— Ты умеешь грамотно и красиво писать, дружишь с русским языком.
— Легко находишь общий язык с людьми и любишь общаться.
— Ответственный, внимательный и умеешь держать несколько задач под контролем.
— Опыт в продажах через переписку будет огромным плюсом.

Если тебе интересно — напиши нам в Telegram

Пару слов о себе, своем опыте. Ждём тебя в команде!

Долина Ботов

12 Dec, 10:36


Революция в ИИ на iPhone и Mac.

Apple официально запустила iOS 18.2, iPadOS 18.2 и macOS Sequoia 15.2 с интеграцией ChatGPT. Чат-бот заменил Siri, а нейросети стали доступнее, чем когда-либо.

Что нового:

• Теперь вместо привычной Siri можно напрямую общаться с ChatGPT (версия GPT-4o). Запускается командой: «Hey, Siri, call ChatGPT». Умеет:
— отвечать на сложные вопросы;
— помогать с задачами (например, планировать события);
— генерировать тексты любой сложности.

• Image Playground — создаёт картинки прямо из iPhone. Поддерживается в Messages, Keynote и Freeform.

• Genmoji — создает уникальные эмодзи из описаний или фото.

• Writing Tools с Describe Your Change — переписывает тексты: исправляет ошибки, сокращает или расширяет текст, меняет стиль, превращает прозу в стихи.

• Аналог Google Lens — камера теперь распознаёт объекты и даёт информацию о них прямо на экране.

• Интеграция с Mac — ChatGPT ищет информацию по локальным файлам и приложениям, как настоящий ассистент.

❗️Тестировать новые функции м...

Долина Ботов

11 Dec, 21:36


Технологический рывок от Google — новая модель Gemini 2.0 Flash.

Google выпустил новинку Gemini 2.0 Flash, и это заметный шаг вперёд. Разберёмся, что здесь интересного:

• Stream Realtime — самая крутая фича, с которой модель может видеть ваш экран и подсказывать в рилтайме: от анализа кода до подсказок в играх.

• Код и тексты — Flash стал ещё сильнее в написании кода и генерации текста. Результаты сложно отличить от работы копирайтера или разработчика.

• Поддержка мультимедиа — модель теперь работает не только с текстом, но и с видео, аудио и любыми другими данными. Контекстное окно — до 1 млн токенов.

Gemini 2.0 Flash — не просто модель для текста, а инструмент, который начинает понимать контекст экрана и взаимодействовать с ним. Революция? Скорее эволюция, но очень уверенная.

➡️ Попробуем бесплатно с VPN.

Долина Ботов

10 Dec, 16:38


Hedra + ElevenLabs = идеальный тандем для оживления персонажей.

Hedra добавила интеграцию с ElevenLabs. Теперь можно создавать реалистичную озвучку и синхронизацию речи с анимацией прямо в браузере.

• В Audio загружаем аудиофайл или пишем текст, который нужно озвучить. Выбираем голос и язык;
• В Character добавляем изображение персонажа или генерируем по промпту (но лучше своё фото — генерация пока сыровата);
• Жмем Generate Video и получаем видео с анимацией и точным липсинком.

ElevenLabs делает реалистичную озвучку, а Hedra отвечает за анимацию и синхронизацию речи с движениями персонажа.

Лимит: 5 видео в день до 30 секунд.

Получится сильный инструмент — без сложных настроек, но с хорошим результатом. Попробовать можно тут.

Долина Ботов

10 Dec, 10:44


Сделал перевод ключевых моментов со вчерашней презентации Sora, чтобы вы услышали все плюшки видеогенератора из первых уст.

Что ещё интересного нам подготовили OpenAI:

• Выбор формата видео (горизонтальный, квадратный, вертикальный), длины (5–22 сек.), разрешения (до 1080p) и генерация нескольких вариантов сразу.

• Ремиксы и предустановки — можно доработать уже готовое видео текстовой подсказкой, а стиль сохранить для следующих генераций.

• Раскадровка и точный контроль — описываем сцены, задаем временные рамки и добавляем действия.

• Изображения в видео и циклы — загружаем картинку, Sora её анимирует и зацикливает для получения бесконечного эффекта.

Что думаете, оправдался год ожиданий?

🔥 — да, оно того стоило
🤔 — нет, есть альтернативы получше

Долина Ботов

09 Dec, 19:30


OpenAI открыла доступ к Sora.

Мы ждали этого почти год, давайте разбираться, оправдались ли ожидания:

Что умеет?
– Генерация видео по тексту, изображениям и другим видео.
– Создание длинных роликов из нескольких сцен (до 10), каждая сцена — отдельный промт.
– Возможность миксовать, ремиксить и зацикливать видео.

Сильные стороны:
– Отлично справляется с абстракциями, анимационными стилями и пейзажами.
– Реализм, особенно в телепередачах и новостных сюжетах.
– Удобный интерфейс с галереей, папками и доступом к чужим промптам для вдохновения.

Ограничения:
– Физика объектов и движение персонажей иногда выглядят странно.
– Генерации с текстом и сложными деталями всё ещё далеки до идеала.
– Переходы между сценами не всегда согласованы.

Длина видео — до 20 секунд, разрешение до 1080p, но генерацию можно продлевать до 5 раз. На создание одного ролика уходит от 20 секунд до 2 минут.

Доступ дают всем подписчикам ChatGPT — и Plus ($20), и Pro ($200). Подписчикам Plus дают 50 генераций в месяц, а Pro — до 500 бы...

Долина Ботов

09 Dec, 19:30


Сегодня сделали женскую фотосессию подруге в стиле VAMP для оформления ленда.

Показал свою фотосессию другу фотографу в Дубае, он смотрел смотрел, говорит :
- классные фотки хорошо снято.
Я говорю: - ты не понял?)
- он: что?
- я: они сгенерированы😁
Он: 😳

PS: обещаю не превращать канал в фотоблог, LLM, трансформеры и инфернс наше все, но буду делиться интересными AI работами и интеграциями.

Долина Ботов

03 Dec, 13:06


Сегодня и вчера MEGASUMMIT. Слушаю Талеба, кто читал его Черного Лебедя и Антихрупкость?

Он один из первых предсказал финансовый кризис, Кийосаки тоже вчера говорил о том, что вся финансовая система скоро сделает флип и перезапуск.

Долина Ботов

30 Nov, 15:03


Gamma теперь генерирует дизайнерские презентации в пару кликов.

Платформа упростит процесс создания и даст сконцентрироваться на контенте, а не на дизайне.

Что интересного:

• Генерация слайдов по текстовому запросу: вводим промпт, а Gamma автоматически создает слайды, выделяя ключевые идеи и структурируя информацию;

• Преобразование ваших файлов в готовую презентацию;

• Интуитивно понятный интерфейс: без сложных настроек и долгих разборок. Пользователи всех уровней смогут легко и быстро освоить платформу;

• Шаблоны и стили: на сайте множество дизайнерских шаблонов, которые можно легко адаптировать под свои нужды;

• Интеграция с другими популярными сервисами;

• Совместная работа в реальном времени: можно приглашать коллег по команде для совместной работы над презентацией.

Дают 400 бесплатных кредитов, чтобы потестить. Ну и самое приятное — есть поддержка русского языка, так что за текст презентации можно не переживать.

Долина Ботов

29 Nov, 20:10


Просто зацените, кто к нам прорвался за железный занавес и что я нашел по пути в Минск, MR. BEAST легендарный шоколад 🍫 😍

Долина Ботов

29 Nov, 17:52


Выступаю на One AI Forum в Минске: 29-30 ноября.

Мой спич в этот раз будет о LLM для закрытого контура, будем разбирать внедрение в бизнесы и актуальные продуктовые решения для компаний.

Состав сильный предварительно это очень крутой ивент, напишу отчетик вам попозже.

Приглашаю всех на поистине масштабное событие в мире ИИ. One AI Forum объединяет стартапы, лидеров индустрии и венчурные фонды для продвижения инноваций. Это уникальная возможность для стартапов презентовать свои проекты и наладить важные связи.

Что вас ждет:

• 20 выдающихся спикеров из ведущих компаний.
• 120+ презентаций проектов для вдохновения и поиска партнеров.
• 5000+ посетителей из разных стран, включая стартапы, лидеров индустрии и новаторов.
• $100 млн инвестиционный фонд для поддержки перспективных проектов.

Приходите, всех жду. Познакомимся и поболтаем 🤖 ✌🏽

Долина Ботов

28 Nov, 15:30


Чего ждать от ИИ?

У меня на канале вышел свежий подкаст с Ларри — ИИ - архитектором, математиком и сооснователем “УМКА ИИ”.

Обсудили вопросы этики и будущего ИИ: от статистических моделей до влияния на общество.

Если не знали, чем заняться сегодня вечером, велком)

Долина Ботов

28 Nov, 15:30


OpenAI опять в центре скандала.

А разразился он вокруг нашумевшей нейросети для генерации видео — Sora. Группа бета-тестеров, получивших ранний доступ к модели, намеренно слила интерфейс системы в открытый доступ.

В основе протеста — недовольство художников тем, как OpenAI использует их труд. Несмотря на недавнюю оценку компании в $150 млрд, сотни художников привлекаются для тестирования и обратной связи без оплаты.

Особенно триггерит тестеров то, что от OpenAI нужно получить одобрение на публикацию каждого видео, созданного в Sora. "Мы не ваши бесплатные тестировщики багов и пиар-марионетки", — заявляют художники в открытом письме.

OpenAI в ответ подчеркивает добровольность участия в программе и отмечает поддержку художников через гранты и мероприятия. При этом компания не подтверждает подлинность утечки.

Лавочку уже прикрыли, но в X сейчас много новых видео, которые сделали с помощью "слитой Sora". Видео отличаются высокой консистентностью, динамикой и адекватной анатомией. Плюс на них есть водяной ...

Долина Ботов

28 Nov, 11:00


Создание сайтов теперь не сложнее рисования в Paint.

Make Real от tldraw позволяет без программирования и даже установки софта нарисовать макет и получить реальный код.

Как работает:
• делаем набросок прототипа с текстовым описанием;
• выделяем мышкой и жмем в углу Make Real;
• GPT-4V сгенерирует в новом фрейме прототип, который по двойному нажатию становится интерактивным. В углу этого фрейма есть кнопка для копирования кода и ссылки, чтобы потестить в новом окне или поделиться с кем.

Если нужно внести правки — перерисовываем/переписываем что нужно изменить + выделяем ранее сгенерированный фрейм = по нажатию Make Real получаем новую версию с правками.

Работает через сайт и локально.

Долина Ботов

27 Nov, 19:40


🚀 Новые функции в ботах (Bot API 8.0)

Недавно вышло довольно крупное обновление Bot API, которое существенно расширяет возможности Web Apps (Mini Apps). Сегодня рассказываем про самые крутые нововведения Telegram:


Полноэкранный режим
• Mini Apps теперь могут использовать весь экран устройства как в вертикальном, так и в горизонтальном режиме. Это означает, что теперь на компьютерах, в том числе, вы сможете запускать полноценную игру на весь экран, это поможет Mini Apps поддерживать больше жанров игр.

Геолокация и отслеживание движений
• Mini Apps могут запрашивать доступ к геолокации пользователей, что позволяет создавать любые сервисы, основанные на местоположении.
• Кроме того, Mini Apps могут в реальном времени получать данные об ускорении, ориентации и вращении устройства. Данное обновление позволит создавать приложения по типу Doodle Jump, делать сервисы доставки проверяя местоположение.

Платные подписки
• Теперь все боты и Mini Apps могут использовать планы подписок, поддерживаемые Telegram Stars.
• Приложения могут принимать регулярные платежи – или отменять их в любое время. Теперь можно установить несколько тарифов для разных уровней доступа к контенту и функциям, а также теперь не нужно напоминать пользователям об оплате, ведь теперь есть регулярные платежи.

Ярлыки на ваших экранах
• Mini Apps можно добавлять в виде прямых ярлыков на главный экран мобильных устройств. Очень прикольная функция, которая не даст вашему приложению потеряться среди чатов пользователя.

Эмодзи-статусы
• Mini Apps позволяют пользователям выбирать новые эмодзи-статусы через встроенный диалог – или синхронизировать их с внутриигровыми достижениями, сторонними API и другими сервисами. Мини-приложения могут интегрировать API из других сервисов, чтобы мгновенно обновить ваш эмодзи-статус, когда вы начнёте слушать музыку 🎶, откроете книгу 📚 или включите фильм 🍿

Настраиваемый экран загрузки
• Экран загрузки Mini Apps теперь можно кастомизировать через – добавляя свой логотип и фирменные цвета.


Есть идея для Mini App? Обращайся -

Долина Ботов

27 Nov, 09:48


Luma Labs и Runway выпустили свои генераторы изображений.

Luma выкатили Photon, а Runway — Frames. Обе модели заточены под создание изображений в единой стилистике. Киноделам в радость: теперь можно убирать Midjourney из пайплайна и платить на одну подписку меньше. Или нет?

Первые тесты показывают, что переход будет не такой уж и гладкий: качество генерации у Midjourney остается на порядок выше. Но общий тренд понятен: видеогенераторы продолжат развивать собственные модели и, вполне возможно, начнут еще поглядывать в сторону Suno и CapCut.

В этом году Midjourney обещали выпустить 7-ю версию и собственную модель для генерации видео. Но пока тишина. А, учитывая недавний выход редактора Flux Tools, то скоро у Midjourney вообще не останется уникальных фишек.

• Luma Photon уже доступна на сайте, есть бесплатные генерации, но на картинке будет водяной знак.
• Runway Frames постепенно раскатывают платным подписчикам.

Долина Ботов

26 Nov, 16:41


SAMURAI — прокачанный сегментатор для визуального отслеживания объектов.

Помните, летом Meta выкатывали сегментатор Segment Anything Model 2 (SAM 2)? У него были трудности при визуальном отслеживании, особенно в переполненных сценах с быстро движущимися объектами.

Дак вот, SAMURAI — его улучшенная версия. Она использует данные о движении и новый механизм выбора памяти, чтобы эффективно предсказывать движения объектов. Также она улучшает маски для точного отслеживания без необходимости повторного обучения.

SAMURAI работает в рилтайме и показывает хорошие результаты в тестах, достигнув 7,1% прироста AUC на наборе данных LaSOT-ext и 3,5% прироста AO на GOT-10k.

Таблицы сравнения можно найти тут, а код лежит на Github.

Долина Ботов

25 Nov, 16:16


Наша AI генеративка вышла на новый МАШТАБ.

В последнее время замечаю, что всё больше заказчиков предпочитают генеративную рекламу вместо классической. Этому есть несколько причин:

• Эффективность и скорость — ИИ может сгенерировать рекламные тексты и графику за считанные минуты.

• Оптимизация затрат — нейросеть заменяет количество сотрудников, необходимых для разработки креативов.

• Анализ и улучшение — ИИ может проанализировать эффективность рекламных кампаний и дать рекомендации по оптимизации.

• Творчество — нейросети могут предлагать новаторские идеи и концепции, которые могут не прийти в голову креативщикам.

А тем временем наша команда Нейропрoдакшн сделала новый проект для терм, который уже можно увидеть на Останкинской башне.

Кто видел — ставьте 🔥

Долина Ботов

25 Nov, 13:54


Gen-3 Alpha Turbo научился расширять границы видео.

Runway анонсировали Expand Video. Инструмент позволяет плавно выходить за пределы границ кадра, чтобы превратить горизонтальные видео в вертикальные и наоборот — без ущерба для деталей или кадрирования.

Система анализирует контекст сцены и создает логичное продолжение, поддерживая разные стили и жанры. Для получения лучшего результата рекомендую загружать видео, где главный объект находится в центре кадра, и в ролике нет графики или текста.

Как работает:

• Переходим в Generative Video и выбираем модель Gen-3 Alpha Turbo;
• На боковой панели жмем Expand VideoSelect Video и загружаем свой ролик (пока максимальная длительность — 4 секунды);
• Выбираем нужное разрешение: 1280х768 или 768х1280;
• Добавляем текстовую подсказку и жмем Genetate.

Можно запустить несколько расширений подряд, чтобы создать общие планы сцены, а затем наложить исходный материал на расширенное полотно для получения кинематографичного эффекта.

Обновление уже раскатывают всем по...

Долина Ботов

24 Nov, 14:35


А вот и примеры генераций натренированной модели FLUX.

Как вам результат?

👍- супер
🤔 - можно и лучше

Долина Ботов

13 Nov, 13:20


Вышло пятичасовое интервью CEO Anthropic Дарио Амодеи с Лексом Фридманом. Пройдемся по самому интересному:

• На вопрос об AGI Дарио ответил, что если просто экстраполировать графики (а это ненаучно), то можно предсказать, что AGI появится в 2026 или 2027.

• Дарио настроен оптимистично и верит, что скоро у нас будет ИИ уровня человека. При этом ближайшие несколько лет все больше и больше денег будет тратиться на разработку и обучение: к 2027 люди, вероятно, будут строить кластеры стоимостью $100 млрд, тогда как сейчас самые крупные суперкомпьютеры стоят $1 млрд.

• Человеческий интеллект — это не предел. Мы можем сделать модели гораздо умнее нас, особенно в определенных областях (например, в биологии).

• Сейчас модели продолжают невероятно быстро улучшаться, особенно в кодинге, физике и математике. На SWE-bench в начале года LLM достигали 2-3%, а сейчас это около 50%. То, о чем действительно стоит переживать в этих условиях — это монополия на ИИ и сосредоточение власти над ИИ в руках всего нескольких к...

Долина Ботов

13 Nov, 06:19


Автопилот для рутинных рабочих задач.

Context Autopilot — ИИ, который не просто отвечает, а действует и использует инструменты как человек. Благодаря пониманию контекста, он берет на себя основную часть информационной работы:

— создает и редактирует презентации;
— редактирует, создает и форматирует документы и отчеты;
— анализирует документы и электронные таблицы;
— помогает написать, отладить и оптимизировать код.

Autopilot уже показал 90,5% в тесте HELMET 128k и 98% в LOFT 1M, что на 24% и 26% лучше прошлых результатов. Это значит, что ИИ стал еще умнее и полезнее.

Autopilot интегрируется с SharePoint и Google Drive. Доступ раздают через лист ожидания.

Долина Ботов

12 Nov, 21:33


Развернули flux на серваке тестим, интересно получается. Первым делом сгенерировали письменность он конечно нарисовал вязь, но…

Долина Ботов

12 Nov, 12:29


ByteDance соединили генерацию и редактирование изображений.

SeedEdit — большая диффузионная модель для редактирования на основе промпта. Она оптимально балансирует реконструкцию и повторную генерацию изображений, позволяя выполнять последовательные правки изображения.

По простому текстовому запросу SeedEdit позволяет: стилизовать, менять надписи на изображении, менять освещение, фон, позы, выражения лица, заменять, удалять, добавлять объекты и многое другое.

Подробнее можно почитать тут, а затестить демку на huggingface.

Долина Ботов

12 Nov, 07:17


Google DeepMind релизнули веса и код AlphaFold 3.

AlphaFold 3 — это новая модель ИИ от Google DeepMind и Isomorphic Labs, которая может предсказать структуру и взаимодействие всех молекул жизни с беспрецедентной точностью.

AlphaFold 3 изменит наше понимание биологического мира и поможет в открытии лекарств. Isomorphic Labs уже сотрудничает с фармацевтическими компаниями, чтобы применить AlphaFold для решения реальных задач и разработать новые, меняющие жизнь пациентов методы лечения.

Раньше ученые могли получить доступ только через AlphaFold Server, с ограничением в 20 запросов в день. Теперь код выложили на гитхабе, а веса доступны по запросу.

Лицензия некоммерческая и очень жёсткая, использование коммерческим организациям и в коммерческих целей запрещено.

Долина Ботов

10 Nov, 13:04


Восстановленную с помощью ИИ песню The Beatles номинировали на премию Грэмми.

Трек «Now and then» пытались восстановить еще в 90-х, но тогда технологии не позволяли разделить вокал Джона Леннона и фортепиано. В 2021 с этим справился MAL — это ИИ-модель команды Питера Джексона для восстановления архивных записей.

Релиз песни состоялся в ноябре прошлого года. А сейчас, спустя более 50 лет после распада, группа номинирована на Грэмми в номинациях: «Запись года» и «Лучшее рок-исполнение».

Долина Ботов

09 Nov, 16:03


ИИ добрался до Голливуда.

Новый фильм «Тогда. Сейчас. Потом» — яркий пример этого. Режиссеру потребовалось рассказать историю семьи на протяжении 60 лет. И вместо традиционных приемов с разными актерами или сложным гримом использовал технологию real-time deepfake от стартапа Metaphysic.

Прямо во время съемок можно было увидеть на мониторе актера в любом нужном возрасте для каждой сцены. Со слов режиссера, это позволило сэкономить время и снизить бюджет картины.

Стартап Metaphysic стал известен благодаря вирусным дипфейк-видео с Томом Крузом еще в 2021 году, а сейчас стал важной частью процесса съемки фильмов.

Тут больше информации о процессе съемок и самой технологии.

Долина Ботов

09 Nov, 08:07


Suno намекнули, что новая версия модели уже не за горами.

Пока без подробностей, удалось лишь отыскать несколько примеров генераций от Suno V.4. По-моему, звучит очень достойно и вполне естественно.

🔥 — ждём

Долина Ботов

08 Nov, 13:52


У FLUX 1.1 [pro] появились режимы Ultra и Raw.

Стартап Black Forest Labs, который в 2024 году основали выходцы из Stability AI, добавил новые режимы для своей модели генерации изображений Flux 1.1 Pro.

• Ultra создает изображения с разрешением в 4 раза выше, чем стандартная FLUX 1.1 [pro]. При этом модель точно понимает запрос и генерирует изображения примерно за 10 секунд.

• Режим Raw предназначен для генерации фотореалистичных изображений. Особенно хорошо ей удаются портреты и пейзажи. Raw-картинки выглядят более натурально, как фотографии.

Одно изображение стоит $0,06. Оба инструмента доступны через API, а также на Fal, Replicate и Krea.

Долина Ботов

27 Oct, 17:29


Следим за питанием с помощью нейросетей.

Приложение CalZen на базе ИИ подсчитает калорийность блюда по одному фото, распишет БЖУ и ингредиенты.

— Если от «глаз» нейронки что-то скрылось, можно самостоятельно добавить недостающий продукт;
— Также можно полностью текстом описывать прием пищи, например, если вы забыли сделать фото;
— Фотки можно выбирать из Галереи смартфона;
— Самое интересное — ИИ оценивает полезность каждого блюда по 10-бальной шкале, чтобы вы знали, на какие продукты не стоит налегать, чтобы держать себя в форме.

Пока доступно только на iOS.

Долина Ботов

27 Oct, 11:55


Самый нужный промпт на выходные.

С ним ChatGPT превратится в кинокритика и подберет вам подходящий фильм на вечер. Сохраняем и больше не мучаемся с вопросом «что бы посмотреть?»:

Ты — кинокритик. Задай мне 4 вопроса и после этого предложи 5 фильмов для просмотра. Задавай вопросы в формате интервью — задаешь вопрос, дожидаешься ответа, только после этого задаешь следующий. Предлагай не только блокбастеры, но и любые фильмы любых стран, которые с высокой вероятностью будут мне интересны. К каждому фильму добавь описание и три причины, почему их стоит посмотреть. Предлагай фильмы разного формата, ищи разные связки с моими интересами.

Долина Ботов

26 Oct, 10:50


Что-то на красивом.

Парень сделал вымышленную рекламу для парфюма Miss Dior. Получилось очень изящно и нежно.

Для создания он использовал:

Midjourney и Mystic v2 — генерация изображений;
Gen-3 Alpha turbo — видео;
Magnific — апскейл;
Udio — музыка;
ElevenLabs — озвучка;
CapCut — монтаж.

Долина Ботов

25 Oct, 16:54


OpenAI готовит к релизу новую модель — Orion.

OpenAI планирует выпустить свою новую флагманскую модель уже в декабре. Исполнительный директор OpenAI намекает на впечатляющие возможности новой модели — она может оказаться в 100 раз мощнее, чем GPT-4. Нейронку обучали на 10 000 графических процессоров H100 от Nvidia.

Но есть нюанс: в отличие от предыдущих моделей GPT-4o и o1, Orion не будет сразу доступна через ChatGPT. Компания сначала предоставит доступ избранным партнерам (таких как Microsoft). Хотя Orion рассматривается внутри OpenAI как преемник GPT-4 (да, о1 это отдельное семейство), неясно, будет ли компания называть его GPT-5 за пределами компании.

Релиз происходит в важный для компании момент — OpenAI только что привлекла рекордные $6.6 млрд инвестиций и переходит в статус коммерческой организации. Так что, это больше не стартап)

Долина Ботов

25 Oct, 10:39


Krea соединяет реальность с ИИ.

Всё благодаря новой функции Video Extend, которая позволяет расширить длительность вашего видео.

Как работает: переходим в раздел Video, загружаем ролик в Start image or video и пишем текстовую подсказку. Нейросеть сделает плавный переход от реального видео к сгенерированному.

Фича доступна во всех представленных видеогенераторах: Luma, Runway, Kling, Hailuo и Pika.

Из минусов: доступно только платным подписчикам, цены начинаются от $10/мес.

Долина Ботов

24 Oct, 13:34


Нейросети уже и в рэпе.

Исполнитель The Game выпустил клип на трек "Bosco Freestyle", который полностью создан с помощью нейросетей.

Получилось ярко, сочно и эффектно.

Долина Ботов

24 Oct, 09:43


Midjourney выпустили свой фоторедактор External Image Editor.

Разработчики представили 2 новые функции, которые позволяют редактировать изображения по текстовому описанию. Ранее можно было работать только с картинками, созданными в Midjourney, а теперь — с любыми.

ИИ-фоторедактор. Пользователь может закинуть свое изображение, выделить любой фрагмент и попросить нейросеть перерисовать по вашей текстовой подсказке.

Перерисовка изображения. Сохраняет композицию, но рисует другое окружение объекта, текстуры и цвета, создавая новые визуальные эффекты. Например:
— добавляет, удаляет, меняет объекты на фото.
— меняет интерьер, фон, цвет, дизайн, одежду.
— меняет стиль изображения.

Доступ пока выдают ограниченно: нужно либо иметь годовую подписку, либо быть подписчиком 12 месяцев, либо нагенерить больше 10.000 картинок.

Долина Ботов

23 Oct, 16:54


У ElevenLabs новый инструмент — Voice Design.

Он создает уникальный голос на основе текстовой подсказки. Просто укажите возраст, пол, тон — любые характеристики, которые для вас важны.

ElevenLabs обещают поддержку неограниченных типов голосовых возможностей, т.е. можно сгенерить не только человеческий голос, но и, например, йети, инопланетян или любого другого фантастического персонажа.

Поддерживает 32 языка (в т.ч. русский), а сама библиотека состоит из более 3000 голосов.

Заходим в раздел Voise — Add new voice — Voice Design.

API будет доступен через 1 неделю, а попробовать на сайте можно уже сейчас. Из России работает только с VPN.

Долина Ботов

22 Oct, 16:34


Доступ ко всем лучшим видеогенераторам за $5.

Playjump — платформа для тех, кто хочет потестить сразу несколько ИИ-генераторов видео. В одном месте тут представлены Luma, Runway, Kling, Kling Pro и Minimax.

Также разработчики добавили:
— управление движением камеры;
— добавление звука на видео;
— выбор кадров;
— стилизация видео;
— увеличение масштаба;
— улучшение подсказок и т.д.

Бесплатно можно создать только 1 ролик, но за подписку в $5 вы сможете сгенерировать около 40 видео и выбрать для себя лучший генератор.

Долина Ботов

22 Oct, 12:34


xAI выпустил API с доступом к языковой модели grok-beta.

О релизе API рассказал сам Маск. При работе с моделью grok-beta 1 млн «входных» токенов будет стоить $5, а «выходных» — $15. 1 млн токенов — это примерно 750 тысяч слов.

API поддерживает вызов функций, чтобы можно было обращаться ко «внешним инструментам» — дата-базам и поисковым движкам.

В документации API упоминаются последние языковые модели стартапа Grok-2 и Grok-2 mini, но пока доступна именно Grok-2.

Долина Ботов

21 Oct, 18:04


Нейросеть для преобразования текста в речь в реальном времени.

Sonic — самая быстрая модель, которая может передавать первый байт аудио всего за 90 мс (это примерно в 2 раза быстрее, чем моргание глаз).

Если для вас в приоритете не скорость, а качество, разработчики утверждают, что Sonic — лучший выбор для озвучки или дубляжа видео. Тут можно выбрать язык (поддерживает 14 языков, включая русский), голос, скорость и эмоции, а также добавить несколько голосов озвучки (в альфе).

Поиграл с эмоциями в русской озвучке, и особо не заметил разницы между "злостью", "радостью" или "грустью". Делитесь своими результатами, потестить можно бесплатно, для этого дают 10.000 символов.

Долина Ботов

21 Oct, 14:03


Это могло бы быть идеальное приложение для VR-шлемов.

Но это просто фантазия нейронки Runway, в которую закинули видеореференс.

Скучную реальность она превратила в настоящее путешествие во времени, стилизовала под хоррор, Игру престолов, Майнкрафт и др.

Meta и Apple, берите на заметку)

Долина Ботов

20 Oct, 17:54


Ловите шпаргалку, которая покажет, как генераторы видео изображают разные эмоции.

Конкретно эти видео созданы в Minimax, но примерно такие же результаты вам выдадут и другие видеогенераторы.