Antipov Tech @antipovtechupdates_reimagined Channel on Telegram

Antipov Tech

17 Jan, 11:24

Unitree улучшили маневренность своего гуманоида G1 Bionic.

Компания почти каждый месяц радует обновами, на этот раз они наделили своего робота плавной ходьбой и бегом. Реакция прохожих говорит сама за себя)

1,120

Antipov Tech

26 Dec, 12:18

Tesla показали будущее беспилотного транспорта — Cybercab.

Внутри нет руля и водительского места, а всё пространство предназначено исключительно для пассажиров. Уникальная фишка: управлять автомобилем можно с геймпада (как проводного, так и беспроводного) или через Wi-Fi.

Первый тестовый заезд уже состоялся, и, судя по всему, технология работает. Массовое внедрение сервиса планируется на 2027 год.

Зачем это нужно? Отсутствие физического управления — шаг к полной автономии и отказу от человеческого фактора. Плюс это прямой сигнал для рынка, что Tesla не просто разрабатывает технологию, но и может менять восприятие транспорта как такового.

Идея амбициозная, но под вопросом остается безопасность и взаимодействие с инфраструктурой. Реально ли геймпад и Wi-Fi как управление для автономного транспорта? Пока это выглядит больше как эксперимент, чем готовое решение.

3

Antipov Tech

25 Dec, 19:34

Провели очень красивую фотосессию Олегу Торбосову, 😻приятно работать с такими топовыми предпринимателями 🤗

Тут пополняем наше портфолио:
ФОТОСТУДИЯ

1

Antipov Tech

25 Dec, 17:37

RenderNet превратился в генератор музыкальных клипов.

Новая функция позволяет быстро и просто создать клип, даже если это ваш первый эксперимент. Ловите инструкцию:

— Заходим на сайт и жмем Create Now (в самом верху, напротив "New Feature Alert" и "Stunning Music Videos of Your Characters!";
— Загружаем аудио для клипа. Файл не должен превышать 50 мб, а длительность — до 5 минут;
— Из загруженного аудио выделяем фрагмент, для которого делаем клип, его максимальная длительность — 1 минута;
— На выбор представлены 9 ИИ-аватаров, которые сыграют роль главного исполнителя в клипа, выбираем кто больше нравится;
— Пишем промпт: указываем стиль и другие пожелания.

Увы, потестить бесплатно не дают, нужна платная подписка, которая стартует от $5/мес (только для некоммерческого использования), а в подписке от $14/мес коммерческое использование уже разрешено.

2

Antipov Tech

24 Dec, 14:56

Скоро всех курьеров уволят, и их места займут роботы. Уже через год сквозь огонь, воду и медные трубы вот такой робопес привезет вам пиццу.

2

Antipov Tech

23 Dec, 17:34

CabinaAI обзавелась нейрофотошопом.

Cabina выпустили удобный инструмент для работы с изображениями на базе нейросетей, который умеет:

• Удалять фон — это уже стандартная фича, но зато быстрая и точная.
• Легко исправлять или добавлять детали с помощью кисти.
• Расширять границы — ещё больше пространства для идей.
• Заменять один объект на другой по текстовой подсказке.

Есть бесплатный режим, но для полноценной работы советую приобрести подписку, стартует от $5.

2

Antipov Tech

23 Dec, 15:19

o3 от OpenAI оказалась одним из лучших программистов на планете.

Как вы помните, OpenAI недавно представили новую модель o3, и она буквально ворвалась в топ мирового рейтинга Codeforces — крупнейшей платформы спортивного программирования.

Немного безумных фактов:
— Рейтинг o3: 2727, а это соответствует 175 месту в мире.
— Результат соответствует званию международного гроссмейстера (гроссмейстеров всего чуть более 300 человек).
— Для сравнения, лидеры рейтинга — профессионалы с многолетним опытом и победители мировых олимпиад.

Codeforces — это не просто сайт, а сообщество из десятков тысяч программистов, где ранги распределяются от новичков (до 1200 баллов) до легендарных гроссмейстеров (от 3000 баллов).

Старший вице-президент по исследованиям OpenAI Марк Чен отмечал, что его личный рейтинг около 2500. Лидер платформы Геннадий Короткевич имеет 3985 баллов — недостижимую высоту для большинства людей.

Вот так o3 доказала, что искусственный интеллект может не просто решать задачи, но и соревноваться на ур...

2

Antipov Tech

21 Dec, 05:44

OpenAI показали новые модели о3 и о3-mini.

Что ж, вот и финальная презентация от OpenAI и сразу 2 модели. о3 уже показывает безумные результаты в кодинге и других тестах, а в тесте на AGI обходит людей (но ещё не AGI). И вроде пора собираться на завод, но есть нюанс.

Что известно:

• Кодинг: на Codeforces о3 достигла рейтинга 2727, а это даже лучше, чем у инженера OpenAI. Фактически о3 пишет код на 30% эффективнее предыдущих версий.
• Математика: в тесте AIME 2024 о3 набрала 96,7%, пропустив всего одну задачу. Для сравнения, это уровень 2,5% лучших студентов-математиков США.
• Обучение: в бенчмарке ARC (тест потенциального AGI) модель достигла 87,5%. Предыдущий рекорд был 50%, а среднестатистический человек набирает около 85%.

Нюансы:

• Затраты на вычисления пока слишком высокие. Решение одной сложной задачи в режиме максимальной точности стоит ~$17-20.
• Хотя о3 близка к AGI по ряду параметров, это всё ещё не полноценный общий искусственный интеллект.

Сейчас модель проходит тестирование на безопаснос...

3

Antipov Tech

14 Dec, 12:01

Некоторые пользователи уже получили доступ к «видящему» ChatGPT и делятся результатами первых тестов.

А как бы вы использовали эту фичу?

628

Antipov Tech

14 Dec, 10:16

Вышла обновлённая модель Pika 2.0.

Что нового:

• Функция Scene Ingredients. Теперь можно загружать свои изображения – персонажей, предметы, декорации и описывать сцену промптом. ИИ автоматически определит роль каждого элемента и объединит их в одну сцену.

• Визуальные эффекты вышли на новый уровень, особенно в контексте управления деталями и последовательностью.

• Также обещают хорошее выравнивание текста, что бы это ни значило.

Демка красивая, но бесплатно потестить не дают. А еще у них водяной знак даже на платных тарифах. Чтобы его убрать, нужен максимальный тариф Fancy (76$/мес). Потестить можно тут.

591

Antipov Tech

13 Dec, 21:22

В ChatGPT завезли «Проекты» — больше никакого хаоса.

Мы дождались: теперь можно объединять чаты, файлы и инструкции в одном проекте. Особенно обновление оценят те, кто работает с объёмными задачами в ChatGPT, будь то разработка, аналитика или создание контента.

Как это работает:

• Все материалы в одном проекте — добавляете код, документы, графики, выгрузки из чатов — всё, что нужно.
• Чат адаптируется — задаёте кастомные инструкции под каждый проект, чтобы ChatGPT сразу понимал, что от него хотят.
• Контекст на лету — бот запоминает всё, что загружено, и отвечает на вопросы, исходя из этих данных.
• Для разработчиков это буквально папки, которые раньше приходилось держать где-то отдельно. Например, весь код и документацию для приложения теперь можно хранить в одном проекте и работать в едином пространстве.

Главное, что «Проекты» убирают хаос и позволяют сосредоточиться на решении задач, а не на поиске нужной информации среди кучи чатов.

Платным подписчикам уже доступны «Проекты», а у вех остальных поя...

682

Antipov Tech

13 Dec, 13:30

Krea AI открыли доступ к своему редактору изображений на базе ИИ.

Бесплатно и прямо в браузере можно:
✔️ Расширять границы изображений.
✔️ Заменять, добавлять или удалять объекты на фото по промпту.
✔️ Генерировать новые области изображения или отдельные фрагменты.
✔️ Перемещать элементы внутри кадра.

Интерфейс интуитивно понятный, а результаты выглядят натурально: тени, перспективы и общая стилистика картинки сохраняются.

Если вам нужен аналог Photoshop с ИИ-фичами — вперед тестировать.

633

Antipov Tech

13 Dec, 11:36

Ищем клиентского менеджера по заявкам для нейро-фотосессий

Привет! У нас бум заявок на услугу нейро-фотосессий. Уже больше 30 заявок в день, и мы ищем человека, который поможет обрабатывать их быстро и качественно.

Что нужно делать:
— Обрабатывать входящие заявки в Telegram.
— Общаться с клиентами: отвечать на вопросы, помогать оформить заказ.
— Следить, чтобы всё шло гладко и без задержек.

Кого мы ищем:
— Ты умеешь грамотно и красиво писать, дружишь с русским языком.
— Легко находишь общий язык с людьми и любишь общаться.
— Ответственный, внимательный и умеешь держать несколько задач под контролем.
— Опыт в продажах через переписку будет огромным плюсом.

Если тебе интересно — напиши нам в Telegram

Пару слов о себе, своем опыте. Ждём тебя в команде!

587

Antipov Tech

12 Dec, 10:36

Революция в ИИ на iPhone и Mac.

Apple официально запустила iOS 18.2, iPadOS 18.2 и macOS Sequoia 15.2 с интеграцией ChatGPT. Чат-бот заменил Siri, а нейросети стали доступнее, чем когда-либо.

Что нового:

• Теперь вместо привычной Siri можно напрямую общаться с ChatGPT (версия GPT-4o). Запускается командой: «Hey, Siri, call ChatGPT». Умеет:
— отвечать на сложные вопросы;
— помогать с задачами (например, планировать события);
— генерировать тексты любой сложности.

• Image Playground — создаёт картинки прямо из iPhone. Поддерживается в Messages, Keynote и Freeform.

• Genmoji — создает уникальные эмодзи из описаний или фото.

• Writing Tools с Describe Your Change — переписывает тексты: исправляет ошибки, сокращает или расширяет текст, меняет стиль, превращает прозу в стихи.

• Аналог Google Lens — камера теперь распознаёт объекты и даёт информацию о них прямо на экране.

• Интеграция с Mac — ChatGPT ищет информацию по локальным файлам и приложениям, как настоящий ассистент.

❗️Тестировать новые функции м...

1,416

Antipov Tech

11 Dec, 21:36

Технологический рывок от Google — новая модель Gemini 2.0 Flash.

Google выпустил новинку Gemini 2.0 Flash, и это заметный шаг вперёд. Разберёмся, что здесь интересного:

• Stream Realtime — самая крутая фича, с которой модель может видеть ваш экран и подсказывать в рилтайме: от анализа кода до подсказок в играх.

• Код и тексты — Flash стал ещё сильнее в написании кода и генерации текста. Результаты сложно отличить от работы копирайтера или разработчика.

• Поддержка мультимедиа — модель теперь работает не только с текстом, но и с видео, аудио и любыми другими данными. Контекстное окно — до 1 млн токенов.

Gemini 2.0 Flash — не просто модель для текста, а инструмент, который начинает понимать контекст экрана и взаимодействовать с ним. Революция? Скорее эволюция, но очень уверенная.

➡️ Попробуем бесплатно с VPN.

808

Antipov Tech

10 Dec, 16:38

Hedra + ElevenLabs = идеальный тандем для оживления персонажей.

Hedra добавила интеграцию с ElevenLabs. Теперь можно создавать реалистичную озвучку и синхронизацию речи с анимацией прямо в браузере.

• В Audio загружаем аудиофайл или пишем текст, который нужно озвучить. Выбираем голос и язык;
• В Character добавляем изображение персонажа или генерируем по промпту (но лучше своё фото — генерация пока сыровата);
• Жмем Generate Video и получаем видео с анимацией и точным липсинком.

ElevenLabs делает реалистичную озвучку, а Hedra отвечает за анимацию и синхронизацию речи с движениями персонажа.

Лимит: 5 видео в день до 30 секунд.

Получится сильный инструмент — без сложных настроек, но с хорошим результатом. Попробовать можно тут.

573

Antipov Tech

10 Dec, 10:44

Сделал перевод ключевых моментов со вчерашней презентации Sora, чтобы вы услышали все плюшки видеогенератора из первых уст.

Что ещё интересного нам подготовили OpenAI:

• Выбор формата видео (горизонтальный, квадратный, вертикальный), длины (5–22 сек.), разрешения (до 1080p) и генерация нескольких вариантов сразу.

• Ремиксы и предустановки — можно доработать уже готовое видео текстовой подсказкой, а стиль сохранить для следующих генераций.

• Раскадровка и точный контроль — описываем сцены, задаем временные рамки и добавляем действия.

• Изображения в видео и циклы — загружаем картинку, Sora её анимирует и зацикливает для получения бесконечного эффекта.

Что думаете, оправдался год ожиданий?

🔥 — да, оно того стоило
🤔 — нет, есть альтернативы получше

710

Antipov Tech

09 Dec, 19:30

OpenAI открыла доступ к Sora.

Мы ждали этого почти год, давайте разбираться, оправдались ли ожидания:

Что умеет?
– Генерация видео по тексту, изображениям и другим видео.
– Создание длинных роликов из нескольких сцен (до 10), каждая сцена — отдельный промт.
– Возможность миксовать, ремиксить и зацикливать видео.

Сильные стороны:
– Отлично справляется с абстракциями, анимационными стилями и пейзажами.
– Реализм, особенно в телепередачах и новостных сюжетах.
– Удобный интерфейс с галереей, папками и доступом к чужим промптам для вдохновения.

Ограничения:
– Физика объектов и движение персонажей иногда выглядят странно.
– Генерации с текстом и сложными деталями всё ещё далеки до идеала.
– Переходы между сценами не всегда согласованы.

Длина видео — до 20 секунд, разрешение до 1080p, но генерацию можно продлевать до 5 раз. На создание одного ролика уходит от 20 секунд до 2 минут.

Доступ дают всем подписчикам ChatGPT — и Plus ($20), и Pro ($200). Подписчикам Plus дают 50 генераций в месяц, а Pro — до 500 бы...

821

Antipov Tech

09 Dec, 19:29

Сегодня сделали женскую фотосессию подруге в стиле VAMP для оформления ленда.

Показал свою фотосессию другу фотографу в Дубае, он смотрел смотрел, говорит :
- классные фотки хорошо снято.
Я говорю: - ты не понял?)
- он: что?
- я: они сгенерированы😁
Он: 😳

PS: обещаю не превращать канал в фотоблог, LLM, трансформеры и инфернс наше все, но буду делиться интересными AI работами и интеграциями.

771

Antipov Tech

26 Nov, 16:41

SAMURAI — прокачанный сегментатор для визуального отслеживания объектов.

Помните, летом Meta выкатывали сегментатор Segment Anything Model 2 (SAM 2)? У него были трудности при визуальном отслеживании, особенно в переполненных сценах с быстро движущимися объектами.

Дак вот, SAMURAI — его улучшенная версия. Она использует данные о движении и новый механизм выбора памяти, чтобы эффективно предсказывать движения объектов. Также она улучшает маски для точного отслеживания без необходимости повторного обучения.

SAMURAI работает в рилтайме и показывает хорошие результаты в тестах, достигнув 7,1% прироста AUC на наборе данных LaSOT-ext и 3,5% прироста AO на GOT-10k.

Таблицы сравнения можно найти тут, а код лежит на Github.

2

Antipov Tech

25 Nov, 16:16

Наша AI генеративка вышла на новый МАШТАБ.

В последнее время замечаю, что всё больше заказчиков предпочитают генеративную рекламу вместо классической. Этому есть несколько причин:

• Эффективность и скорость — ИИ может сгенерировать рекламные тексты и графику за считанные минуты.

• Оптимизация затрат — нейросеть заменяет количество сотрудников, необходимых для разработки креативов.

• Анализ и улучшение — ИИ может проанализировать эффективность рекламных кампаний и дать рекомендации по оптимизации.

• Творчество — нейросети могут предлагать новаторские идеи и концепции, которые могут не прийти в голову креативщикам.

А тем временем наша команда Нейропрoдакшн сделала новый проект для терм, который уже можно увидеть на Останкинской башне.

Кто видел — ставьте 🔥

3

Antipov Tech

25 Nov, 13:54

Gen-3 Alpha Turbo научился расширять границы видео.

Runway анонсировали Expand Video. Инструмент позволяет плавно выходить за пределы границ кадра, чтобы превратить горизонтальные видео в вертикальные и наоборот — без ущерба для деталей или кадрирования.

Система анализирует контекст сцены и создает логичное продолжение, поддерживая разные стили и жанры. Для получения лучшего результата рекомендую загружать видео, где главный объект находится в центре кадра, и в ролике нет графики или текста.

Как работает:

• Переходим в Generative Video и выбираем модель Gen-3 Alpha Turbo;
• На боковой панели жмем Expand Video — Select Video и загружаем свой ролик (пока максимальная длительность — 4 секунды);
• Выбираем нужное разрешение: 1280х768 или 768х1280;
• Добавляем текстовую подсказку и жмем Genetate.

Можно запустить несколько расширений подряд, чтобы создать общие планы сцены, а затем наложить исходный материал на расширенное полотно для получения кинематографичного эффекта.

Обновление уже раскатывают всем по...

562

Antipov Tech

24 Nov, 14:35

А вот и примеры генераций натренированной модели FLUX.

Как вам результат?

👍- супер
🤔 - можно и лучше

1,558

Antipov Tech

24 Nov, 14:35

Самая хайповая фишка для генерации портретов.

Заметил, что сейчас стала популярна услуга — нейрофотосессия, а инфлюенсеры на волне хайпа продают её по 10 тыс. рублей. Делюсь с вами инструкцией, как сэкономить деньги и буквально за полчаса сделать свою персональную фотосессию бесплатно с помощью Flux. Результаты получаются действительно крутые и реалистичные. Значительно лучше, чем в Midjourney.

Даже не придется ничего устанавливать локально, нам понадобится сайт Tost.AI. Тут можно попробовать новые модели и пайплайны и натренировать свою LoRa. Чем мы и займемся.

Кстати, на hugging face уже есть куча интересных LoRa, которые загрузило сообщество за полгода существования Flux.

• Регистрируемся на Tost.ai;

• В первом поле выбираем [Train Lora], а в следующем меняем c7ay1fy на наше слово-триггер — когда оно появится в промте, ваши картинки будут референсом, загружаем изображения через кнопку Add (желательно 20-30 фото с разрешением 1024х102) после чего жмем Enter;

• Ждём 15-30 минут;

• В правом верхнем ...

589

Antipov Tech

23 Nov, 15:59

Нейросеть для учебы Otio крупно обновилась.

Это инструмент на базе GPT-4o, Claude 3.5 и Mistral, который умеет:

• Делать саммари объемных материалов: длинных видео, томов научного текста и т.д;
• Отвечать на вопросы по содержанию вашего файла;
• Редактировать текст или с нуля писать доклады и рефераты.

Чтобы сэкономить сотни часов и оптимизировать учебы достаточно закинуть файл и ввести текстовую подсказку.

629

Antipov Tech

22 Nov, 14:33

BlackForest Labs выпустили пачку контролнетов для FLUX.1 под названием FLUX.1 Tools.

Вернее, это полноценные модели по 24Гб со встроенным функционалом контролнета. Depth и Canny есть также в виде лоры.

Сюда входят:

• FLUX.1 Fill — модель для инпейтинга и аутпейтинга, позволяющая вписывать/менять объекты на картинках или расширять кадр.
• FLUX.1 Depth — изменение картинки на основе карты глубины.
• FLUX.1 Canny — изменение картинки на основе карты очертаний.
• FLUX.1 Redux — адаптер для получения вариаций изображения.

Доступно по API для [pro] и в опенсорсе для [dev]
А также на сайтах партнеров: fal.ai, Replicate, Together.ai, Freepik, krea.ai.

1

Antipov Tech

21 Nov, 11:33

Suno выпустили V4 своего генератора музыки. Что нового:

• Нам обещают чистые голоса и насыщенную структуру треков;

• Самое интересное — свои старые треки теперь можно добить до качества V4 (вероятно работает только с генерациями внутри Suno). Бесплатно можно проапгрейдить 1 трек;

• Улучшенное создание текстов с помощью ReMi;

• Старые фичи Covers и Personas тоже получили апгрейд;

• Обновился раздел Explore — можно покрутить барабан обновленных жанров;

• Также обновили дизайн музыкальных обложек.

Suno V4 пока доступна только платным подписчикам.

762

Antipov Tech

21 Nov, 07:13

Михаил Галустян с утра выпил лавандовый раф и превратился в Николая Василенко.

Друзья, я решил сделать вот такую добрую интеграцию и договорился с классными людьми, которых вы точно знаете и любите.

Создано с помощью:

• Akool отвечает за замену лица;
• Kits AI — за замену голоса.

Хорошего вам дня, улыбайтесь)

789

Antipov Tech

21 Nov, 07:13

Михаил Галустян с утра выпил лавандовый раф и превратился в Николая Василенко.

Друзья, я решил сделать вот такую добрую интеграцию и договорился с классными людьми, которых вы точно знаете и любите.

Создано с помощью:

• Akool отвечает за замену лица;
• Kits AI — за замену голоса.

Хорошего вам дня, улыбайтесь)

611

Antipov Tech

20 Nov, 12:10

Google представили ИИ-репетитора.

LearnLM 1.5 Pro — это семейство моделей ИИ для учебы, которое лежит в основе Learn About.

Нейросеть адаптируется под ученика, стимулирует любопытство и упрощает обучение. Достаточно ввести любой вопрос, уравнение или задачу, а ИИ выдаст подробный ответ.

Также в Поиске появится возможность упрощать сложные темы, а в YouTube — задавать вопросы во время просмотра образовательных видео.

Контекст 32К токенов, есть поддержка русского языка. Пользуемся с VPN на США — тут.

578

Antipov Tech

20 Nov, 10:01

Видеогенератор Vidu обновился до версии 1.5.

Новая модель поддерживает генерацию по тексту и картинкам, добавление последнего кадра, а также соединение сразу двух референсов.

Также улучшилось качество видео (720р и 1080р) и появились новые функции:

• Reference to Video — ИИ анализирует ваши загруженные изображения, запоминает ключевые моменты и на их основе создает новый ролик;

• Movement Amplitude — настройка динамичности анимации (сделать плавней или добавить больше движений);

• Advanced Character Control — появилось больше контроля над движением камеры.

В месяц дают 80 бесплатных кредитов. Их хватит на 20 стандартных видео длительностью по 4 секунды.

611

Antipov Tech

19 Nov, 13:52

Состояние агентов ИИ в 2024 году.

LangChain провели анализ, в котором приняли участие 1300+ человек — от инженеров и продакт-менеджеров до бизнес-лидеров и руководителей.

• Выяснилось, что около 51% респондентов уже используют агентов в производстве, а 78% планируют внедрить агентов в производство в ближайшее время.

• Основные варианты использования агентов:
— проведение исследований и саммари объемных документов (58%);
— оптимизация задач для личной производительности или помощи (53,5%);
— обслуживание клиентов (45.8%);
— генерация кода (35,5%).

• Существуют два основных барьера:
— нехватка знаний: команды часто испытывают трудности с техническими аспектами работы с агентами;
— временные затраты: требуется значительное время на разработку, отладку и оценку работы агентов.

• Истории успеха агентов:
Cursor — редактор кода на базе ИИ занимает первое место, как самое обсуждаемое приложение-агент. За ним следуют такие тяжеловесы, как Perplexity и Replit.

Эти приложения расширяют границы возможностей агентов, показывая, что агенты ИИ больше не являются теоретическими — сегодня они решают реальные проблемы в производственных средах.

• Преимущества агентов:
— управление многошаговыми задачами;
— автоматизация повторяющихся задач;
— маршрутизация задач и совместная работа;
— человеческое мышление.

Особый ажиотаж вызывают агенты ИИ с открытым исходным кодом. Многие ждут, что следующий скачок в развитии агентов ИИ будет осуществляться на основе более крупных и эффективных моделей, чтобы агенты могли решать еще более сложные задачи с большей эффективностью и автономностью.

944

Antipov Tech

19 Nov, 09:53

Mistral AI выпустили мультимодальную модель с 124 млрд параметров и обновили чат-бот Le Chat.

• Pixtral Large — мощная LLM, которая сочетает текстовый анализ и обработку изображений. Судя по бенчмаркам, она превосходит конкурентов в распознавании текста (OCR), анализе графиков и документов.

• Le Chat теперь ищет ответы в интернете и приводит ссылки на источники. Чтобы включить веб-поиск нажимаем на кнопку Web Search под полем для запроса.

Также появилась генерация изображений. Под «капотом» — модели Flux от стартапа Black Forest Labs. Они же используются в чат-боте Grok. Включить генерацию можно по кнопке под полем для запроса — Image Generation.

Режим Canvas запускает 2 окна — это «холст» для работы над текстом и кодом и диалог с чат-ботом (ChatGPT выпустил такой же режим в октябре 2024 года, но для платных подписчиков).

➡️Тестим бесплатно на сайте, веса лежат тут.

753

Antipov Tech

18 Nov, 15:09

С помощью Runway Gen-3 показали, как бы выглядела японская версия советской классики — «Кавказской пленницы».

2

Antipov Tech

16 Nov, 09:40

Stability AI выпустили официальный гайд по написанию промптов для Stable Diffusion 3.5.

Ключевой момент — в промпте должны быть 5 основных параметров: стиль, объект и действие, технические параметры, текст, негативный промпт.

• Стиль — одним-двумя словами задаем формат (фотореализм, рисунок, анимация);
• Объект и действие — указываем объекты, только после этого описываем что они делают;
• Технические параметры — прописываем детали освещения и угол съемки;
• Текст — при желании добавляем текст в кавычках ("");
• Негативный промт — заранее исключаем ненужные элементы через параметр «Negative: …».

➡️Полный гайд лежит тут, а тестим здесь.

823

Antipov Tech

15 Nov, 09:36

ChatGPT стал доступен на Windows для всех.

Если раньше пользоваться десктопным чат-ботом могли только платные юзеры, то теперь — все желающие. Но это не единственная новость.

Приложение для Mac обновили. Теперь оно может работать напрямую с Xcode, VS Code и терминалом.

Приложение видит только то, что показано на экране, или выделено в редакторе кода. Т.е. оно не имеет доступа к файлам проекта и не может заглянуть в них, чтобы сгенерировать код с учётом всей кодовой базы. Код, который вы выделяете, помещается в контекст модели, и по нему можно задавать вопросы/просить что-то переписать.

ChatGPT стремится привлечь разработчиков различными фичами, хотя с точки зрения удобства и UX это пока не самое лучшее решение. Пока лидируют Copilot и Cursor, но OpenAI постепенно заходит и в эту нишу.

➡️Качаем на Windows или Mac

4

Antipov Tech

14 Nov, 12:01

В видеоредакторе Final Cut Pro 11 появились ИИ-фичи.

Apple анонсировали релиз Final Cut Pro 11 спустя 13 лет после выпуска прошлой версии. Вот самое интересное:

• Magnetic Mask — новый инструмент на базе ИИ, который выделяет людей и объекты в видеоклипе без использования хромакея и без необходимости обработки кадра вручную.

• Transcribe to Captions — создает субтитры, анализируя речь видео с помощью языковой модели, обученной Apple (работает на Мас с чипами M, работающих на macOS Sequoia).

• Появилось редактирование пространственных видео, снятыми с Vision Pro, iPhone 15 Pro и выше. Можно добавлять титры, применять цветокоррекцию и эффекты, а затем отправлять полученные ролики на Vision Pro (также требуется Mac с чипом M).

Также вышел и Final Cut Pro 2.1 для iPad. В нём можно добавлять собственные анимации Live Drawing, появились эффекты улучшения света и сцен, новые эффекты кадрирования, а на временной шкале поддерживаются варианты 90, 100 и 120 кадров в секунду для повышения плавности картинки.

Нов...

2

Antipov Tech

13 Nov, 13:20

Вышло пятичасовое интервью CEO Anthropic Дарио Амодеи с Лексом Фридманом. Пройдемся по самому интересному:

• На вопрос об AGI Дарио ответил, что если просто экстраполировать графики (а это ненаучно), то можно предсказать, что AGI появится в 2026 или 2027.

• Дарио настроен оптимистично и верит, что скоро у нас будет ИИ уровня человека. При этом ближайшие несколько лет все больше и больше денег будет тратиться на разработку и обучение: к 2027 люди, вероятно, будут строить кластеры стоимостью $100 млрд, тогда как сейчас самые крупные суперкомпьютеры стоят $1 млрд.

• Человеческий интеллект — это не предел. Мы можем сделать модели гораздо умнее нас, особенно в определенных областях (например, в биологии).

• Сейчас модели продолжают невероятно быстро улучшаться, особенно в кодинге, физике и математике. На SWE-bench в начале года LLM достигали 2-3%, а сейчас это около 50%. То, о чем действительно стоит переживать в этих условиях — это монополия на ИИ и сосредоточение власти над ИИ в руках всего нескольких к...

716

Antipov Tech

13 Nov, 06:19

Автопилот для рутинных рабочих задач.

Context Autopilot — ИИ, который не просто отвечает, а действует и использует инструменты как человек. Благодаря пониманию контекста, он берет на себя основную часть информационной работы:

— создает и редактирует презентации;
— редактирует, создает и форматирует документы и отчеты;
— анализирует документы и электронные таблицы;
— помогает написать, отладить и оптимизировать код.

Autopilot уже показал 90,5% в тесте HELMET 128k и 98% в LOFT 1M, что на 24% и 26% лучше прошлых результатов. Это значит, что ИИ стал еще умнее и полезнее.

Autopilot интегрируется с SharePoint и Google Drive. Доступ раздают через лист ожидания.

802

Antipov Tech

12 Nov, 21:33

Развернули flux на серваке тестим, интересно получается. Первым делом сгенерировали письменность он конечно нарисовал вязь, но…

716

Antipov Tech

05 Nov, 21:20

Организаторы разместили его на трех медиафасадах в Москве.

525

Antipov Tech

05 Nov, 21:20

Роботы! 13-14 ноября я отправляюсь на форум THE TRENDS!

🏆 Объективно для меня это самое мощное событие про Blockchain, искусственный интеллект, крипту и IT

С таких мероприятий уношу всегда самое ценное - это новых крутых людей, вдохновляюсь и заряжаюсь на пару месяцев вперед.

————————————
🔥Впервые за много лет в Москве выступят:

Davinci Jeremie,
Carl Runefelt (The Moon),
Andres Meneses (Crypto OGs),
Serge Ajamian (Ordinals)
Danosch Zahedi (Co-founder Arts DAO)
и другие топовые спикеры, а также представители крупнейших международных компаний.

Форум проходит при поддержке
генерального спонсора JJO

Более 4500 участников, свыше 100 спикеров и лучшие возможности для нетворкинга и партнерств!

Очень советую! Таких мероприятий в России не было уже несколько лет, учитываю нашу изоляцию).

Ознакомиться с программой и приобрести любые билеты с 20% скидкой можно тут

799

Antipov Tech

05 Nov, 21:20

спрошу у гпт

649

Antipov Tech

05 Nov, 21:20

Джереми Давинчи который будет на конференции без преувеличения легендарный дяденька. Он известен тем ю, что пророчил в далеком и 2013 году, одним из первых на ютубе купить биткоин хотя бы на 1$.

Перевод его того самого легендарного видео:

https://youtu.be/t_mq-eG2kEE?si=fC-BFzvsZF8ZVqZz

564

Antipov Tech

05 Nov, 21:20

Скайнет вас запомнил

555

Antipov Tech

05 Nov, 21:20

Для The TRENDS Мы сделали промо ролик, полностью нейронками.

740

Antipov Tech

05 Nov, 13:40

Claude 3.5 Sonnet теперь поддерживает чтение PDF-файлов с изображениями.

Новая модель Claude 3.5 Sonnet (claude-3-5-sonnet-20241022) поддерживает ввод PDF-файлов и распознает как текстовый, так и визуальный контент в документах: диаграммы, графики, схемы, таблицы и тд.

Может пригодиться для:

— Анализа финансовых отчетов и понимания диаграмм/таблиц;
— Извлечения ключевой информации из юридических документов;
—Помощи в переводе документов и многого другого.

Максимальный размер файла должен не превышать 32 мб, кол-во страниц — до 100.

819

Antipov Tech

04 Nov, 16:46

Нейросети в строительстве.

Наткнулся на необычный кейс использования Claude. Ему показали видео со стройки и попросили выписать все критические и опасные моменты в Excel-таблицу, а потом проанализировать их. Это стало возможно благодаря Computer use, который может автономно управлять компьютером.

В итоге, нейросеть составила подробную таблицу, где все косяки строителей разбиты на категории, предложены пути решения, назначены дедлайны и ответственные. Конечно, документ придется перепроверить, но эта таблица — уже значительная польза для специалистов.

Даже в бесплатный ChatGPT можно закинуть фотографии или скриншоты видео и попросить то же самое в формате таблицы. Вот для примера промпт, который использовали для Claude:

Hey Claude with Computer use, watch this construction site video & write up things you see that dangerous or good, create a spreadsheet of critical issues to address.

845

Antipov Tech

03 Nov, 13:32

Blendbox показали новый способ генерации изображений.

И он дает еще больше контроля над процессом, позволяя создать каждый объект по отдельности.

С помощью промпта генерим части изображения (фон, водопад, девушку, здание и т.д), а после — соединяем их в единый коллаж.

На демонстрации все выглядит вполне естественно, каждый объект подстраивается под другие объекты и реалистично вписывается в композицию.

➡️ Потестить можно только с подпиской (от $10/мес).

826

Antipov Tech

03 Nov, 08:16

Text2Avatar уже в HeyGen.

Свежее обновление облегчает процесс создания нейроаватара. Если раньше нужно было обучать модель на многочисленных фото персонажа, теперь достаточно ввести промпт.

• Заходим в Avatars — Photo Avatar — Create Photo Avatar — Generate;
• Указываем имя, возраст, пол, национальность вашего аватара и пишем текстовую подсказку (например: Young Adult Any Woman wearing a sweater vest sitting in a chair with a book in her hand. Outside on the patio);
• Нажимаем Generate Preview и ждём около 30 секунд;
• На выходе получаем 2 готовых аватара, которые можно изменить.

➡️ Тестим новинку бесплатно.

3

Antipov Tech

02 Nov, 17:12

Google релизнули платформу для обучения — Learn About.

Это интерактивное учебное пособие, которое на ходу создает материал под вас, помогая освоить любую тему.

Можно попросить ИИ упростить ответ, проиллюстрировать его с помощью картинок, углубиться в подробности, задать уточняющие вопросы, перейти к изучению похожих тем. Даже можно загружать картинки, примеры и задачи.

В отличие от привычных статичных источников, Learn About выглядит как виртуальный репетитор, который делает процесс обучения интересным и увлекательным.

Google напоминает, что платформа пока экспериментальная и возможны неточности. Поэтому рекомендую перепроверять инфу.

➡️Пробуем тут. Бесплатно, но доступно только в США, так что заходим с VPN.

737

Antipov Tech

02 Nov, 12:38

В Gen-3 Alpha Turbo теперь можно управлять камерой.

Runway обновили свою модель и добавили функцию Camera Control. Она позволяет контролировать движения камеры в сгенерированных сценах, включая: панорамирование, перемещение вперед и назад, вверх, вниз, приближение, отдаление и наклоны.

Самое интересное, что можно сочетать сразу несколько действий для создания сложных последовательностей и управлять их интенсивностью.

Обновление уже доступно всем пользователям бесплатно, тестим тут.

759

Antipov Tech

01 Nov, 11:25

В Suno добавили функцию «Персоны».

С ее помощью можно на основе созданных треков делать своих персонажей. Модель запомнит нужный вокал, стиль и атмосферу и будет использовать их в дальнейших генерациях.

Как это работает:

— находим в библиотеке трек с нужным голосом;
— нажимаем на знак с 3 точками и открываем раздел Create;
— идем в Make Persona, даем ей имя, аватар и описание.

Готово. Вашу «Персону» можно использовать для генерации новых треков.

Бета-версия доступна для подписчиков Pro и Premier. На старте дают создать 200 песен, а далее каждая генерация будет стоить 10 кредитов.

➡️ Тестим тут

746

Antipov Tech

31 Oct, 19:11

OpenAI выпустили продвинутую поисковую систему ChatGPT Search.

Она анализирует тысячи ресурсов и выдает быстрые, точные и актуальные ответы вместе с ссылками на источники. Поиск интегрирован с новостными и информационными ресурсами: AccuWeather, Reuters и Financial Times и др., с которыми OpenAI заключали соглашения последний год.

Поиск поддерживает голосовые и визуальные функции и знает русский язык.

Функция уже доступна пользователям ChatGPT Plus и Team. Для бесплатных пользователей обновление раскатают в ближайшие месяцы.

3

Antipov Tech

31 Oct, 09:11

Прокачали генератор изображений Recraft V3.

На выбор доступны 2 модели:
— Для генерации реалистичных изображений;
— Для векторных. Особенно хорошо получаются кнопки и иконки для сайтов и приложений. Готовый результат можно экспортировать в формате SVG в отличном качестве.

На этом достоинства Recraft V3 не заканчиваются, нейронка умеет генерировать длинные надписи без ограничений, кастомизировать текст (шрифт, размер и расположение), а обновленный редактор — в пару кликов объединяет картинку с вашим текстом.

Разработчики ежедневно накидывают по 50 кредитов. Пробуем бесплатно здесь.

767

Antipov Tech

31 Oct, 04:07

Хинтон - тот самый товарищ, который разработал принципы обучения нейросетей, на базе которых, работают современные LLM и именно его вклад был существенный, чтобы мы могли попросить chatGPT написать пост или контент план .))

4

Antipov Tech

31 Oct, 04:07

Перелет, смотрю выступление Джеффри Хинтона, лауреата премии Тьюринга и обладатель Нобелевской премии по физике в 2024 г., где он рассказывает о нелинейности нейронов. Хотя он уважает логический подход, он понимает, что мозг работает не совсем линейно и логически. Линейное мышление — это достаточно ограниченный инструмент.
Моя аналогия ведёт к тому, что в жизни люди, несмотря на то что их мозг устроен для нелинейного мышления, на самом деле часто думают линейно, и в этом наше ограничение. Мы слишком сильно опираемся на логический инструмент. Хотя нейроны работают нелинейно, мы для достижения целей часто используем линейное и логическое мышление, исключая нелинейные подходы, которые кажутся нам вариативностью и неопределённостью. Как раз интуиция - проявление нелинейного мышления, за который топят серьезные дяди. Решение которое чувствуем жабрами, но объяснить логически не можем.)

Хотя надо признать есть люди, обладающие развитым системным мышлением, способны просчитывать множество вариантов и предсказыват...

2

Antipov Tech

30 Oct, 13:49

Обновление видеогератора PixVerse V3.

Новая модель получила полезные фичи — эффекты, стили, продление и липсинк:

• Разработчики обещают повышенную точность и крутую динамику видео;
• Поддерживаются несколько соотношений сторон: 16:9, 9:16, 3:4, 4:3, 1:1;
• В «Стили» добавили аниме, 3D-анимацию и глину;
• Новые эффекты: взрыв, смятие, превращение в зомби, зомби-руки, нашествие монстров и фокусы с волшебной шляпой.

Также можно выбрать длительность видео (5 или 8 секунд).

При регистрации каждый пользователь получает бесплатно 100 кредитов, плюс ежедневно докидывают еще по 30.

2

Antipov Tech

30 Oct, 07:56

В веб-версию ChatGPT добавили поиск по чатам.

Теперь можно ввести запрос в поисковую строку, и ChatGPT покажет релевантные ветки с превью. Работает с ответам из чата, а не только по его названию, как в Claude.

Обновление уже доступно подписчикам Plus и Team, а для всех бесплатных пользователей доступ откроют в ноябре.

➡️ Идем проверять

3

Antipov Tech

28 Oct, 15:52

Сейчас очень много нейронок для создания музыки. Я решил собрать топ самых интересных представителей с широким функционалом:

• Suno
• Udio
• Soundraw
• Mubert
• Boomy
• Riffusion
• Loudly
• Musicfy
• Sonauto
• Jen

Пишите, кого ещё забыл)

882

Antipov Tech

28 Oct, 11:49

Неделю назад Runway показали новую фичу Act One, а сейчас — открыли доступ для всех.

Напомню, это инструмент для переноса своей мимики на персонажей. Специальное оборудование не нужно, достаточно видео с собой.

Бесплатно, но из-за высокого спроса пока работает только у платных подписчиков ($15/мес).

Также Runway выкатили гайд, как добиться лучших результатов, а энтузиасты уже нагенерили примеры работы обновы.

733

Antipov Tech

27 Oct, 17:29

Следим за питанием с помощью нейросетей.

Приложение CalZen на базе ИИ подсчитает калорийность блюда по одному фото, распишет БЖУ и ингредиенты.

— Если от «глаз» нейронки что-то скрылось, можно самостоятельно добавить недостающий продукт;
— Также можно полностью текстом описывать прием пищи, например, если вы забыли сделать фото;
— Фотки можно выбирать из Галереи смартфона;
— Самое интересное — ИИ оценивает полезность каждого блюда по 10-бальной шкале, чтобы вы знали, на какие продукты не стоит налегать, чтобы держать себя в форме.

Пока доступно только на iOS.

912

Antipov Tech

27 Oct, 11:55

Самый нужный промпт на выходные.

С ним ChatGPT превратится в кинокритика и подберет вам подходящий фильм на вечер. Сохраняем и больше не мучаемся с вопросом «что бы посмотреть?»:

Ты — кинокритик. Задай мне 4 вопроса и после этого предложи 5 фильмов для просмотра. Задавай вопросы в формате интервью — задаешь вопрос, дожидаешься ответа, только после этого задаешь следующий. Предлагай не только блокбастеры, но и любые фильмы любых стран, которые с высокой вероятностью будут мне интересны. К каждому фильму добавь описание и три причины, почему их стоит посмотреть. Предлагай фильмы разного формата, ищи разные связки с моими интересами.

938

Antipov Tech

26 Oct, 10:50

Что-то на красивом.

Парень сделал вымышленную рекламу для парфюма Miss Dior. Получилось очень изящно и нежно.

Для создания он использовал:

⭐ Midjourney и Mystic v2 — генерация изображений;
⭐ Gen-3 Alpha turbo — видео;
⭐ Magnific — апскейл;
⭐ Udio — музыка;
⭐ ElevenLabs — озвучка;
⭐ CapCut — монтаж.

653

Antipov Tech

25 Oct, 16:54

OpenAI готовит к релизу новую модель — Orion.

OpenAI планирует выпустить свою новую флагманскую модель уже в декабре. Исполнительный директор OpenAI намекает на впечатляющие возможности новой модели — она может оказаться в 100 раз мощнее, чем GPT-4. Нейронку обучали на 10 000 графических процессоров H100 от Nvidia.

Но есть нюанс: в отличие от предыдущих моделей GPT-4o и o1, Orion не будет сразу доступна через ChatGPT. Компания сначала предоставит доступ избранным партнерам (таких как Microsoft). Хотя Orion рассматривается внутри OpenAI как преемник GPT-4 (да, о1 это отдельное семейство), неясно, будет ли компания называть его GPT-5 за пределами компании.

Релиз происходит в важный для компании момент — OpenAI только что привлекла рекордные $6.6 млрд инвестиций и переходит в статус коммерческой организации. Так что, это больше не стартап)

626

Antipov Tech

25 Oct, 10:39

Krea соединяет реальность с ИИ.

Всё благодаря новой функции Video Extend, которая позволяет расширить длительность вашего видео.

Как работает: переходим в раздел Video, загружаем ролик в Start image or video и пишем текстовую подсказку. Нейросеть сделает плавный переход от реального видео к сгенерированному.

Фича доступна во всех представленных видеогенераторах: Luma, Runway, Kling, Hailuo и Pika.

Из минусов: доступно только платным подписчикам, цены начинаются от $10/мес.

1

Antipov Tech

24 Oct, 13:34

Нейросети уже и в рэпе.

Исполнитель The Game выпустил клип на трек "Bosco Freestyle", который полностью создан с помощью нейросетей.

Получилось ярко, сочно и эффектно.

774

Antipov Tech

24 Oct, 09:43

Midjourney выпустили свой фоторедактор External Image Editor.

Разработчики представили 2 новые функции, которые позволяют редактировать изображения по текстовому описанию. Ранее можно было работать только с картинками, созданными в Midjourney, а теперь — с любыми.

⭐ ИИ-фоторедактор. Пользователь может закинуть свое изображение, выделить любой фрагмент и попросить нейросеть перерисовать по вашей текстовой подсказке.

⭐ Перерисовка изображения. Сохраняет композицию, но рисует другое окружение объекта, текстуры и цвета, создавая новые визуальные эффекты. Например:
— добавляет, удаляет, меняет объекты на фото.
— меняет интерьер, фон, цвет, дизайн, одежду.
— меняет стиль изображения.

Доступ пока выдают ограниченно: нужно либо иметь годовую подписку, либо быть подписчиком 12 месяцев, либо нагенерить больше 10.000 картинок.

732

Antipov Tech

23 Oct, 16:54

У ElevenLabs новый инструмент — Voice Design.

Он создает уникальный голос на основе текстовой подсказки. Просто укажите возраст, пол, тон — любые характеристики, которые для вас важны.

ElevenLabs обещают поддержку неограниченных типов голосовых возможностей, т.е. можно сгенерить не только человеческий голос, но и, например, йети, инопланетян или любого другого фантастического персонажа.

Поддерживает 32 языка (в т.ч. русский), а сама библиотека состоит из более 3000 голосов.

Заходим в раздел Voise — Add new voice — Voice Design.

API будет доступен через 1 неделю, а попробовать на сайте можно уже сейчас. Из России работает только с VPN.

1

Antipov Tech

Antipov Tech (Russian)

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

Antipov Tech

1,226

269

299

Best Similar Channel

Random Similar Channel