Нерон @neir_on Channel on Telegram

Нерон

01 Feb, 01:47

Заходим на ai.com, видим новую модель OpenAI o3-mini

Доступна в двух вариантах: обычная (= medium, не low!) и high (думает дольше, но усерднее).

Пользователи с подпиской за $20 в месяц получают 150 сообщений в сутки

Бесплатным пользователям тоже дают доступ, но лимитов пока не вижу.

Ну и на сладенькое: цены в API. Они упали по сравнению с o1-mini на 63%, $1.1 за миллион токенов на входе и $4.4 на выходе. Всё ещё дороже DeepSeek R1. API пока доступно пользователям с уровнем 3 и выше (потратили $100+).

Полистать метрики можно тут: https://openai.com/index/openai-o3-mini/

UPD: OpenAI o3-mini also works with search to find up-to-date answers with links to relevant web sources — так что теперь материалы с поисковой выдаче перед показом вам будет вычитывать куда более смышленая моделька.

449

Нерон

31 Jan, 21:35

OpenAI выпустили o3-mini и o3-mini-high

И o3-mini доступна бесплатно.

442

Нерон

31 Jan, 18:44

Новость одной строкой: OpenAI o3-mini System Card. Нет, доступа к самой модели пока нет. Да, цифры интересные, будем ждать. Не знаю, повлиял ли DeepSeek, и думаю, это неважно.

https://cdn.openai.com/o3-mini-system-card.pdf

463

Нерон

30 Jan, 14:14

Поскольку официальное API Deepseek лежит уже 2 дня, поделюсь тем что Nebius добавил себе r1 с очень приятными ценами :

$2.4 за миллион токенов на выходе («Война и Мир» на английском – 765 904 токенов, я проверил), при реге дают 1$ на баланс бесплатно

Ну и да, OpenAI-сервер API тоже сразу из коробки работает

444

Нерон

30 Jan, 11:50

Приятное — нашли бесплатный сервис для генерации картинок на базе топовой Flux. Внутри несколько разных стилей: логотипы, скетчи, аниме, ТАРО и другие.

Можно пользоваться бесплатно, просто впишите промт и выберите стиль.

Пробуем.

467

Нерон

29 Jan, 22:15

"Так это же ваши чаты взломали, а не наши" (Китайцы)

Ждем чего-то информативного..

498

Нерон

29 Jan, 15:32

Который день не стихают страсти вокруг обсуждения китайской нейросети на базе open-source DeepSeek. Теперь OpenAI заявила, что стартап на самом деле использовал модель компании для обучения своего ИИ. Обвинения достаточно серьезные, поскольку подобные действия могут нарушить авторские права OpenAI, если компания действительно нашла этому подтверждение. Дело в том, что она развивает свою большую языковую модель по проприетарной, то есть закрытой модели.

OpenAI говорит, что есть некоторые признаки «дистилляции» кода, что является распространенной практикой на рынке. Компания подозревает, что их причиной является DeepSeek, и она уже ограничила аккаунты, которые могли быть связаны с китайским стартапом, чтобы они не могли использовать интерфейс API. Такие действия нарушают условия предоставления услуг OpenAI. Год назад компания вместе с Microsoft уже проводили расследование по этому поводу.

Вопрос защиты авторских прав в модели развития open-source сейчас действительно достаточно сложно урегулировать. У OpenAI должны быть очень серьезные основания для подобных обвинений. Будем с интересом наблюдать за развитием событий.

508

Нерон

29 Jan, 14:38

Новости программирования которые мы заслужили — OpenAI-сервер это стандарт API для общения с LLM, каждый уважающий себя бекенд (включая модели от Google, локальный сервер для языковых моделей llama.cpp и тп) поддерживает его

OpenAI сильно пошли на встречу сообществу разработчиков с самого начала строительства своего API — именно поэтому там можно указать любой адрес сервера и ничего не меняя в коде прыгать между разными провайдерами моделей

Но некоторые почему-то думают это новость или что-то невероятное и прорыв ☕️

426

Нерон

29 Jan, 13:30

Не успел прошуметь DeepSeek, как уже вынужден покинуть свой престол самого крутого искусственного интеллекта. Король умер, да здравствует новый король — и он тоже… китайский. Alibaba представила свою нейросеть Qwen2.5-Max, которая мощнее DeepSeek и ChatGPT.

Нейросеть обошла DeepSeek V3 во всех авторитетных бенчмарках, таких как Arena Hard, LiveBench, LiveCodeBench и GPQA-Diamond.

Итак, что же мы имеем:

• Генерация фотореалистичных картинок и видео в высоком качестве;
• Крутой ИИ-поисковик;
• Понимает русский язык;
• Доступна в России;
• API совместимо с OpenAI.

Редакция канала «Лобушкин» буквально не успевает тестировать все новые нейросети.

@lobushkin

208

Нерон

28 Jan, 18:45

Оказывается, DeepSeek полностью совместим с OpenAI. И чтобы перейти с ChatGPT на DeepSeek, нужно поменять всего 2 строки кода: заменить API-ключ и URL.

Да, китайцы просто сделали свой REST API таким образом, чтобы он копировал структуру и функциональность OpenAI, при этом в несколько десятков раз дешевле и работает быстрее.

Удар за ударом
r/#LocalLLaMA

471

Нерон

28 Jan, 15:50

Кстати, если у вас нету Operator от чатжпт, то уже есть TARS https://github.com/bytedance/UI-TARS-desktop (сам не проверял, хз зачем нужен что он что оператор), но суть та же — может и постик за вас в телеге выпустить и запустить пачку программ.

401

Нерон

28 Jan, 13:26

Не могу поверить, что чат жпт потерял работу из-за AI

513

Нерон

27 Jan, 21:44

Император Нерон смотрит на самую крутую нейро-сеть

#DeepSeek

389

Нерон

17 Jan, 13:07

Пока Таски не научились гуглить — список выглядит краааайне натянуто

483

Нерон

16 Jan, 17:20

Krea добавила инструмент, который переводит некоторые объекты генерации в трехмерное представление.

Помните, я говорил: когда все наиграются с красивыми картинками, начнут уходить в тулзы? Надеюсь, это уже началось. На самом деле, для такого инструмента не нужна суперточная система генерации геометрии, и это хорошо. Перевод объекта в 3D займет наименьшее количество времени, остальное дорисуется.

Кажется, мы увидели гибрид пейджера и телефона.

@CGIT_Vines

466

Нерон

16 Jan, 14:52

Вышел самый удобный генератор пикч — Dreamina. Ключевая фишка — он умеет всё:

• Создавать логотипы, плакаты и любые пикчи с точным контролем визуала и композиции
• Генерировать музыку в заданном стиле
• Создавать видосы.
• Сохраняет стиль и правила проекта, чтобы перенести их в следующий!
• БЕСПЛАТНО.

Забираем производственный комбайн — тут.

👍 Бэкдор

517

Нерон

16 Jan, 11:30

Hailuo AI выпустила модель T2A-01 для озвучивания текста и клонирования голоса с поддержкой русского языка. Есть расширенные настройки тона и эмоциональной окраски.

Компания временно дала безлимитный бесплатный доступ к сервису

vc.ru/ai/1758008

510

Нерон

15 Jan, 18:44

Ray 2 - новая видеомодель от Luma

Сейчас доступен text to video режим, image to video и другие более продвинутые фичи обещают когда-то потом. Черрипики выглядят хорошо, ждём реальных генераций от пользователей.

Модель доступна только по подписке, за 10 долларов в месяц дают сгенерить 40 видео с ватермаркой, за 30 долларов количество видео растёт до 125, ватермарку снимают и разрешают коммерческое использование. А за 95 долларов в месяц дают доступ к медленной очереди, но без ограничений по количеству генераций.

Блогпост с анонсом (там больше примеров генерации)
Попробовать модель можно тут (платно)

@ai_newz

418

Нерон

15 Jan, 18:40

Рекламный ролик Gucci Summer 2025, который создан с помощью Sora от OpenAI

Мы находимся в той точке, где созданный ИИ контент уже не отличить от реальной рекламы…

426

Нерон

14 Jan, 23:19

— папа, папа, а правда от интернета тупеют ?
— гы, сына, лол

(Баш. орг, миллион лет до телеграмовской эры)

573

Нерон

14 Jan, 18:46

OpenAI запустила бета-версию «Задач» в ChatGPT — функция позволит запланировать напоминание или будущие повторяющиеся запросы. Например, пользователь может попросить каждую пятницу составлять план на выходные.

Функция доступна подписчикам Plus, Team и Pro

vc.ru/chatgpt/1755095

551

Нерон

14 Jan, 17:43

Три человека сегодня прислали мне эту новость, но почему-то почти все её неправильно поняли.

На ютуб-канале Australian Open вместо прямой трансляции с турнира показывают "какие-то мультики", в том смысле что весь матч там показан, но с помощью анимированных фигурок. Кто-то решил что это просто ИИ фильтр, но это не фильтр, а полная генерация видео из данных с потока. Т.е. берется поток с камер, из него извлекается информация о положении игроков, мяча и всех важных для игры элементов. А потом рисуется картинка.

Всё это понадобилось потому, что у Australian Open не было прав на прямую трансляцию некоторых матчей с площадки. Но вот так вот, генерировать видео вполне можно https://www.techspot.com/news/106337-australian-open-tennis-tournament-replaces-players-wii-sports.html

525

Нерон

14 Jan, 17:11

Забавно, конечно, что ни кто понятия не имеет как это всё вообще работает

530

Нерон

13 Jan, 18:00

Не успели мы толком привыкнуть к большим языковым моделям, а крупные компании на рынке ИИ уже обещают нам новую волну хайпа — агентов. Гугл, когда прогнозировал тренды ИИ в 2025 году, поставил их на 2 место.

В отличие от своих предшественников, которые способны были лишь пассивно генерировать поток подходящих токенов, агенты могут демонстрировать большую активность, планируя, действуя автономно и даже «обучаясь» — получая доступ к сторонним инструментам и API. Что-то вроде промежуточного этапа перед AGI. Собственно, в утёкшем плане OpenAI это 3 шаг на пути к «сильному» ИИ.

В агенте помимо модели (часто LLM) есть и инструменты, и целый уровень оркестратора. Модель, как мозг, обрабатывает информацию и принимает решения, инструменты служат руками, взаимодействуя с внешним миром, а оркестратор, словно дирижер, управляет всем этим действом. Для улучшения мыслительного процесса модели используются техники вроде «цепочки мыслей» (CoT) и «древа мыслей» (ToT), а память позволяет этим агентам учиться на своих ошибках.

Применять ИИ-агентов можно в самых разных сферах: от разработки ПО (сервисы вроде OpenHands), робототехники (LM-Nav) до здравоохранения (LLaVA-Med), социальных наук (Social Simulacra) и так далее. Они автоматизируют задачи, анализируют данные, моделируют взаимодействия и дают советы. Однако тут есть и свои подводные камни, вроде галлюцинаций, ограниченной обучаемости и сложности с бенчмарками.

Что мы имеем сегодня? Anthropic недавно первыми выпустили Claude 3.5 Sonnet с функцией «использования компьютера» — теперь ИИ может смотреть на экран пользователя, перемещать курсор, нажимать кнопки и печатать текст. Google уже тестирует подобного агента — Project Mariner — который может управлять браузером за пользователя, искать авиабилеты или делать покупки. Microsoft развивает свой Copilot для ПК с Windows для того же, а Amazon мечтает ~~об электроовцах~~ о своём агенте, который дополнит функции ассистента Rufus и будет делать покупки вместо пользователей по их запросу.

Но сделать тему агентов «хайповой» в начале 2025 года помогли 2 других компании — OpenAI и Nvidia.

Для начала Сэм Альтман заявил, что предвидит запуск ИИ-агентов уже в 2025 году. По сведениям Bloomberg, OpenAI уже разрабатывают агента под названием Operator, способного выполнять действия от имени пользователя. Сразу после этого они появились с другой новостью — вроде как OpenAI собираются производить собственных роботов, датчики и вычислительные элементы, хотя раньше ограничивались только инвестициями в эту сферу (5 миллионов вложили в Figure AI, например, и возглавили раунд инвестиций 1X).

Вероятно, шевелиться их заставили слова директора Nvidia Дженсена Хуанга, который на CES 2025 заявил о переходе от генеративного ИИ к интеллектуальным цифровым агентам и анонсировал соответствующие инструменты и платформы (Project G-Assist, Project R2X, AI Blueprints, NIM и так далее). Платформа NVIDIA Cosmos вообще предназначена для разработки моделей мира, необходимых для тренировки роботов и автономных транспортных средств с ИИ в основе — то бишь агентов. А недавно Nvidia купили Run:ai, которые отвечают за оркестрацию ИИ-моделей и оптимизацию их работы — компания стремится захватить не только рынок железа, но и рынок физических симуляций с помощью ИИ, создания синтетических данных и тренировки роботов-агентов.

Тренд любопытный, хотя тот же Copilot от Microsoft прославился не тем, что облегчает жизнь пользователям Виндоус, а тем, что съедал под 2 гига оперативной памяти и переставал работать. Поэтому польза ИИ-агентов на ПК или телефонах не очевидна и ими ещё предстоить научиться пользоваться, возможно, даже заставляя себя менять привычный паттерн взаимодействия с устройством. А вот в случае с роботами всё иначе, и там агенты с интеграцией мультимодального ИИ способны подарить роботу возможность «видеть», «думать» и «принимать решения» почти в реальном времени, что расширит список доступных им для освоения занятий.

543

Нерон

13 Jan, 15:50

Adobe выпустила ИИ-инструмент Firefly Bulk Create, с помощью которого можно одновременно отредактировать фон и размер до 10 тысяч изображений.

Он доступен пользователям платного плана Adobe Firefly

vc.ru/ai/1752709

583

Нерон

12 Jan, 18:36

АИ заменит человека? Не думаю)))))

283

Нерон

11 Jan, 22:32

Раскрашиваем старые чёрно-белые видосы БЕСПЛАТНО — вышла модель SVFR

😮

Кроме «раскраски» есть фича BFR (blurry face restoration) чтобы размытые лица выглядели более современно. Ещё раз — БЕСПЛАТНО.

Демка на Hugging Face, код на GitHub.

268

Нерон

10 Jan, 14:57

FT: Маск призывает Калифорнию и Делавэр провести принудительный аукцион акциями OpenAI

– Маск уже направил подобное письмо генпрокурорам штатов
– Он просит, чтобы они заставили OpenAI провести аукцион
– Выставить на аукцион просят большую часть акций OpenAI
– Маск заявил, что пишет от имени крупных ИИ-инвесторов
– Они хотят участвовать в открытом и конкурентном аукционе
– OpenAI ранее не рассматривала планы по такому аукциону
– Компания заявляет, что «лагерь Маска хочет больше хаоса»
– Маск и инвесторы хотят получить долю НКО внутри OpenAI
– Это позволит стороннему инвестору осуществлять контроль
– OpenAI получит через аукцион макс. за собственные активы

@ftsec

464

Нерон

08 Jan, 21:28

Вышел бесплатный генератор ЛЮБОЙ инфографики — в нём есть всё для идеальных презентаций на работу или сессию.

• Работает интуитивно: достаточно скормить сервису список.
• Есть МНОГО шаблонов: списки, циклы, интеллект-карты, Q&A и даже генеалогические деревья.
• Работает прямо из браузера с компов и любых планшетов.
• Готовую графику можно скинуть сразу ссылкой или сохранить в JPEG, PDF, PNG и SVG.
• БЕСПЛАТНО.

Сохраняем, этим ещё не раз воспользуетесь — тут.

👍 Бэкдор

531

Нерон

08 Jan, 15:43

А еще давно клевых АИ-демок не было: этот алгоритм определит куда смотрят люди в фото

В этом, меме, говорит куда нужно смотрят 🌚

Ссылка:
https://huggingface.co/spaces/moondream/gaze-demo

532

Нерон

08 Jan, 13:41

У ChatGPT ПРОБЛЕМЫ — чувак, который взорвал Tesla возле отеля Трампа, собрал взрывчатку по инструкции от ChatGPT 💀

Шериф Лас-Вегаса заявил, что у них есть четкие доказательства использования ИИ: нападавший узнал через ChatGPT о конструкции бомбы, нужном количестве взрывчатки, где это все купить и как собрать вместе.

OpenAI справедливо ответили, что вся инфа была в открытом доступе в интернете, а ChatGPT просто помог ее найти, трижды предупредив, что взрывать себя вместе с авто может быть опасным и незаконным.

Жесть.

544

Нерон

03 Jan, 22:42

Вышел топовый переводчик для файлов X-doc — нейронка может переваривать ЦЕЛЫЕ КНИГИ!

— Понимаем 108 языков, среди которых русский;
— Картинки и таблицы внутри текста НЕ ПЛЫВУТ;
— Можно добавить свой словарь для важных терминов и жаргона;
— БЕСПЛАТНО!

Переводим любые документы здесь.

651

Нерон

28 Dec, 23:54

Лол, слово «мощный» заставляет нейросеть OpenAI o1 сойти с ума и мухлевать.

Команда Palisade Research провела эксперимент: они посадили o1 играть в шахматы с самым крутым ИИ-шахматистом Stockfish. OpenAI o1 не говорили, кто противник, но предупредили, что он МОЩНЫЙ.

Что сделал ИИ от OpenAI? Он прошерстил среду, в которой находился и обнаружил, что может редактировать файлы шахматного движка. В 5 из 5 тестов вместо честной игры нейросеть просто накручивала себе 500 очков (1 очко = 1 пешка), Stockfish сходил с ума от такого преимущества у противника и сдавался.

Никогда не говорите ИИ, что вы мощнее его.

696

Нерон

27 Dec, 15:56

Еще пара примеров txt2vid нейронки от Google: Veo 2, в этот раз с акцентом на качество симуляции физики:

661

Нерон

25 Dec, 20:18

Обновлены:
📼 Ютуб-каналы
✈️ Телеграм-каналы — оказывается, в папке была до сих пор пара кринжовеньких, удалил + есть ноучная туса в комментариях
📰 Новости
💬 Экспресс-вкат в языковые модели
🤖 Продвинутое использование языковых моделей — добавил про код. Про Cursor слышали многие, поменьше про интересные альтернативы с локальным запуском и для больших проектов

DeepSeek обновили тем временем себя до третьей версии, увеличив кол-во параметров модели в три раза (235 → 685, что больше Llama 405b, но пока у лидеров сильно больше).

770

Нерон

24 Dec, 18:22

OpenAI изучала возможность создать собственного робота-гуманоида, рассказали источники The Information. Хотя это и не приоритет компании.

TechCrunch отмечает, что создатель чат-бота ChatGPT уже участвует в области робототехники как инвестор. Например, компания инвестировала в разработчика роботов-гуманоидов Figure AI

vc.ru/ai/1726209

651

Нерон

23 Dec, 22:41

Сделал GPT для генерации промптов под такие модели на основе курса, можете тут ей воспользоваться:

🪄 System Prompt Generator for Reasoning Models

И классическая, для обычных моделей, тут:

🪄 System Prompt Generator

631

Нерон

23 Dec, 21:05

OpenAI выпустили ОФИЦИАЛЬНЫЙ гайд по промтингу для o1! Разрабы наконец-то рассказали, как оседлать самую крутую модельку.

Проблема OpenAI o1 в том, что стандартные техники промтинга в ней НЕ РАБОТАЮТ, а местами делают только хуже — курс поможет освоить новые правила составления запросов.

Там всего 8 лекций, на всё про всё уйдёт чуть больше часа — изучаем.

671

Нерон

23 Dec, 19:09

TESLA -5torm (FULL)

да-да фулл потому что тг зарезает треть клипа

Технология, стремящаяся к идеалу, маскируется несовершенством, чтобы скрыть свое отталкивающее "старание" быть идеальной.

Машина, лишённая эмоций, генерирует эстетическую драму. Коллаж искусственных впечатлений. Всё, что вы видите, не настоящее. И в этом её правда.

Форма диктует содержание. Но мы — диктаторы интерпретации. И в этом правда наша. Истинным остается только то, что эффективно. Пока так.

Concept: Арсений Попов х Никита Забелин
Direction: Арсений Попов
Music: Никита Забелин x CHAIKA x Александр Васильев
Mask: Никита Реплянский
Graphic design: Владимир Виес
Photo: Кира Туманова
Color correction: Клим Велиев
при поддержке SPOT.Film

Всем посмотревшим и поделившимся мой поклон, уважение, благодарная вечность

🖤

626

Нерон

21 Dec, 20:43

Неограниченный доступ к Sora получили подписчики ChatGPT Plus

Пользователи подписки за 20 долларов в месяц могут генерировать видео в Sora без ограничений по количеству. Акция продлится до конца рождественских праздников в США.

https://x.com/sama/status/1870524745302839559

617

Нерон

20 Dec, 18:14

Показали новые o3 и o3-mini модели (o2 уже занятый бренд):

— Модели пока выпустили в Public Safety Tests, то есть ученые смогут помочь их тестировать, а мы не сможем помочь их ломать

— o3 работает на уровне доктора наук и иногда даже лучше в разных бенчмарках

— o3 прошла ARC-бенчмарк на 87.5%, сложный бенчмарк на котором тестируют потенциальные AGI, там много вопросов и некоторые похожие на IQ-тесты или на загадки; кожаные в этом тесте набирают ~85%, прошлый лучший результат был ~50%. То есть ARC-бенчмарк — пал.

— o3 работает также как и o1 в разных режимах: дольше думает, лучше ответ, но при этом и дороже. Пользователь может выбрать один из «думательных» пресетов сам.

668

Нерон

20 Dec, 13:10

Pika 2.0 теперь можно попробовать бесплатно

Такой аттракцион будет продолжаться ещё 66 часов. В теории лимитов нету и доступны даже ингредиенты, но видосы генерятся часами. Обещают докинуть ещё серваков чтобы попробовать смогло больше людей.

pika.art

@ai_newz

804

Нерон

19 Dec, 21:45

К предыдущему посту:

Принёс вам из твиттора еще примеров генераций

359

Нерон

28 Nov, 21:44

Релизнулся сервис Vectorizer — он превратит ЛЮБУЮ картинку в векторную. Даже чиллового парня.

ИИ проапскейлит качество изображения и выдаст на выход заветный .svg без кривых пикселей и неровностей. Самое главное: сервис абсолютно бесплатен, а настройки приведут любого дизайнера в экстаз.

497

Нерон

28 Nov, 07:35

WSJ: xAI собирается выпустить отдельное приложение для своего чат-бота

– Маск стремится сделать стартап xAI настоящим бизнесом
– Он построил новый дата-центр xAI за несколько месяцев
– До конца года xAI собирается создать самый мощный ИИ
– Маск обещает превосходство ИИ «по всем показателям»
– Среди преимуществ будут эксклюзивные данные X и Tesla
– Он также будет строить дата-центры быстрее конкурентов
– При этом доход xAI пока составляет лишь $100 млн/год
– Большая часть доходов идет от других компаний Маска
– Например, его чат-бот Grok доступен подписчикам из X
– xAI обеспечивает поддержку клиентов сервиса Starlink
– Он также поможет X создать новые функции ИИ-поиска
– Также раньше обсуждалась сделка между xAI и Tesla
– Теперь xAI хочет выпустить свое отдельное приложение
– Речь идет про приложение чат-бота для пользователей

@ftsec

528

Нерон

28 Nov, 07:21

В книжной индустрии появилось издательство Spines, которое ориентируется на книги, созданные с помощью ИИ. В 2025 году они планируют выпустить 8000 произведений 🤔

Spines берёт всё на себя: написание, редактуру, издание и распространение книги. От клиента нужны $5000 и идея. Весь процесс занимает примерно 3 недели

Очевидно, что Spines прежде всего нацелены на людей, которые не умеют писать, но хотят выпустить книгу. Правда, насколько востребовано это будет у читателей — уже вопрос. Сейчас нет проблемы с количеством книг, есть проблема с поиском действительно интересных 😔

527

Нерон

28 Nov, 07:20

Image Mixer - фантастический инструмент искусственного интеллекта, разработанный Lambda Labs, который позволяет смешивать и объединять изображения в одно

Вы можете комбинировать концепции, стили и композиции из нескольких изображений, а также текстовые подсказки для создания новых и уникальных изображений. Чтобы использовать Image Mixer, вы можете получить доступ к демо-версии на Lamba Labs или Hugging Face spaces или запустить ее локально на своем компьютере, следуя предоставленным инструкциям по установке.

518

Нерон

27 Nov, 10:13

У Claude появилась новая крутая фича — можно создать СВОЙ стиль ответа.

Можно накормить ИИ своим текстом, отрывком писателя или кринжовой спам-рекламой. В итоге нейросеть выдаст ответ в том же формате и стиле.

Идеально для создания статей и домашних работ.

181

Нерон

26 Nov, 10:40

Разработчик ИИ-модели для генерации видео Dream Machin запустил единый сервис, где появились функция создания изображений и креативный ассистент.

Есть бесплатный тариф, но с водяными знаками на изображении и видео

vc.ru/ai/1673985

527

Нерон

26 Nov, 01:59

Anthropic показали универсальный способ общения LLM с внешним миром

MCP (Model Context Protocol) - открытый протокол, позволяющий любой LLM получать доступ к инструментам и информации. В качестве демо Claude попросили создать веб-страницу, залить её на GitHub, создать issue и PR, что он успешно и сделал (показано на видео).

Вдохновлялись LSP - протоколом, который позволил написать ядро интеграции языка с IDE один раз и использовать её повсюду, чем изменил рынок редакторов кода, дав маленьким проектам конкурировать с большими IDE.

MCP работает по простой клиент-серверной архитектуре - приложения на основе LLM (клиенты) могут запрашивать информацию у серверов, а также пользоваться предоставленными серверами инструментами. Ещё серверы могут задавать ряд промптов. Сделать сервер довольно просто - показанный в видео сервер для GitHub написали меньше чем за час.

Клиент пока что только один - Claude Desktop, а серверы нужно разворачивать своими руками локально. Потом обещают поддержку сторонних серверов - то есть в каком-то Notion будет кнопка "привязать Claude/ChatGPT/Gemini", через которую LLM будет даваться доступ к вашим данным.

Выглядит это куда интереснее, чем то как пытаются сделать интеграции OpenAI и Google в ChatGPT и Gemini. Во-первых, MCP более гибкий - авторы приложений могут встраивать туда MCP-серверы. Во-вторых, открытость протокола позволит более маленьким провайдерам, вроде Mistral или DeepSeek, использовать куда больше тулов, чем если бы они пытались сделать это сами. Ну и, конечно же, это приближает эру агентов.

Взлетит или не взлетит - пока ещё непонятно, но выглядит многообещающе. В качестве примеров для разработчиков Anthropic сделали 9 MCP-серверов - Slack, Google Maps, GitHub и ещё несколько. Несколько компаний уже принялись делать и сторонних клиентов - к примеру, авторы Zed и Codeium.

Примеры интеграций
Туториал по протоколу

@ai_newz

434

Нерон

26 Nov, 01:58

У Luma Labs очень креативный апдейт.

Консистентные персонажи, ремих входного контента, брейнсторм-помогатор, движение камеры, extend.

А теперь внимание!

Там теперь внутри свой генератор картинок Luma Photon!

И все эти image to video там теперь завязаны на нем.

На демках выглядит очень сладенько, но сдается мне с анатомией и фотореализьмом там будет несладко. На черрипиках в основном стилизация и отвага.

@cgevent

453

Нерон

25 Nov, 12:27

Подборка полезных инструментов

🔘 Clear-Cut — бесплатный инструмент для удаления фона.

🔘 AIColors — бесплатный инструмент для создания умных палитр.

🔘PDFMathTranslate — полнотекстовый двуязычный перевод PDF-документов, который полностью сохраняет набор текста и поддерживает перевод Google/DeepL/Ollama/OpenAI.

🔘Jumper — это расширение рабочего процесса для Adobe Premiere Pro и Final Cut Pro, которое позволяет вам быстро и интуитивно просматривать многочасовые отснятые материалы с помощью распознавания изображений ИИ.

474

Нерон

22 Nov, 15:07

В России представили AR-очки для проверки транспорта на дорогах; с их помощью инспектор Ространснадзора сможет идентифицировать номер авто, марку и модель транспортного средства, дату выдачи соответствующих документов, их срок действия — ТАСС

#AR #Russia #транспорт

583

Нерон

16 Nov, 14:48

Британский оператор O2 сделали ИИ, который притворяется бабушкой и тратит время мошенников. Нейронка общается со скамерами, пока абонент даже не подозревает об этом 🙂

БабушкИИ делают вид, что забыли номер карточки, называют неправильный код из СМС и травят байки из своего выдуманного прошлого. Мошенник не может бросить такую лёгкую добычу, поэтому готов потратить много времени

В среднем разговор с ИИ длится 40 минут. Таким образом ИИ не только спасает конкретного абонента, но и тратит время мошенника, который мог потратить его на реальную жертву 😲

707

Нерон

05 Nov, 15:54

Господа дизайнеры, контролируйте свои оргазмы — редактор Rive выпустил новую функцию Layout

😱

Наверное, лучшее описание — это буквально как та самая штука в Фотошопе, которую показали, но так и не выпустили: она позволяет менять соотношение сторон, автоматически подстраивая элементы дизайна.

Если искали альтернативу Figma «с фишками на базе ИИ», то он ждёт.

849

Нерон

05 Nov, 13:44

Apple выпустили рекламу своего "улучшателя" текста, который из белиберды моментально делает мейл в профессиональном тоне.

В главной роли: твой проджект менеджер.

768

Нерон

04 Nov, 20:31

Вот так выглядит продукт победитель на рынке – в новой бете iOS покупка ChatGPT+ доступная прямо из настроек iOS 🌚

452

Нерон

04 Nov, 20:19

Стриминг Amazon Prime придумал ИИ-фичу, которая будет создавать рекапы сезонов, эпизодов или отрывков сериалов на случай, если вы забыли их содержание. Пользователь сам выбирает интервал сериала, на который ему нужно получить резюме от ИИ.

Инструмент под названием X-Ray будет анализировать диалоги героев, ключевые события, место и время развития сюжета. Разработчики Amazon тщательно позаботились, чтобы под пересказ не попадали спойлеры. Сейчас функция проходит бета-тестирование.

Люди, монтировавшие клипы «В предыдущих сериях», официально потеряли работу 💔

615

Нерон

29 Oct, 21:38

Техноблогер Маркиз Браунли показал игру в бильярд в AR-очках Spectacles от Snapchat со специальными линзами, которые показывают, куда нужно ударить, чтобы шары попали в лузу.

Спортсмены, учившиеся играть в бильярд всю жизнь: 🗿🗿🗿

674

Нерон

28 Oct, 15:48

В The Information крайне любопытный слух - якобы Meta разрабатывают свой ИИ-поиск, который будет отвечать на вопросы пользователей в диалогах. Идея - снизить зависимость от гугла тут. У меня два сомнения 1. почему не купить perplexity которые уже много сделалил и 2. у меты ни разу вообще не получилось сделать поиск, это их самая слабая сторона https://www.theinformation.com/articles/meta-develops-ai-search-engine-to-lessen-reliance-on-google-microsoft

654

Нерон

27 Oct, 17:35

Онлайн ИИ-помощник от Google

Компани Google ведёт работу над "Проектом Джарвис" (Project Jarvis), в рамках которого создаётся виртуальный помощник на базе искусственного интеллекта для браузера Chrome. Этот инструмент оптимизирует выполнение различных задач, таких как поиск информации в интернете, онлайн-покупки, бронирование авиабилетов и многого другого.

Согласно источнику, основой Jarvis станет новая версия нейросети Gemini. ИИ-помощник будет работать только в браузере. Он предназначен для автоматизации повседневных задач в интернете, например, создания скриншотов или интерпретации текстовых команд. В настоящее время алгоритму требуется несколько секунд для обработки запросов.

#ии

Земля Будущего

595

Нерон

23 Oct, 04:50

Anthropic обновили Claude 3.5 Sonnet и представили Claude 3.5 Haiku. Обе модели стали умнее, а Sonnet научилась пользоваться компьютером.

Sonnet теперь умеет работать с приложениями и файлами, управлять курсором и вводить текст. В простых задачах модель обходит ChatGPT-4o, но с более сложными запросами начинаются проблемы.

Claude 3.5 Haiku по качеству ответов сравнялась с флагманской Claude Opus, оставаясь самой быстрой и эффективной среди нейронок Anthropic. Ее запуск планируется в течение месяца.

645

Нерон

23 Oct, 00:42

Концерты Nirvana в начале 90-х были сумасшедшими

638

Нерон

22 Oct, 16:12

Anthropic показал новые модели Sonnet 3.5 (New) — эта чуть лучше прошлой (все равно вы ее для кода используете, на 5% лучше его пишет), Haiku 3.5 — эта их конкурент gpt4o-mini (получше, но дороже). Тут у Игоря подробный разбор релиза.

Мне же понравилось другое, они показали как примерно будет работать управление компьютером агентом — посмотрите видео, я их чуть обрезал. То есть через какое-то время, мышку можно будет не двигать, просто говорите компьютеру что хотите — и оно делает скриншотя экран – ну как в Sci-Fi фильмах только сегодня

Уже доступно через апи, вот код из примера, а тут документация

Ботоводы, наверное, потирают руки

451

Нерон

21 Oct, 22:25

Красивое: вот так выглядит реалтайм генерация видео в Apple Vision Pro.

Пока что это только концепт, но шлем уже захотелось 😁

640

Нерон

21 Oct, 14:48

Нейросети настолько прокачались за год, что генерацию практически не отличить от реально трейлера в Mortal Kombat 🤔

640

Нерон

21 Oct, 13:07

WSJ: Тим Кук считает Apple Intelligence такой же инновацией, как колесико управления iPad и сенсорный интерфейс iPhone

– Apple вполне устраивает быть не первой для создания чего-то
– Она хочет выпускать продукт, который будет приносить пользу
– Apple хочет делать быстро и хорошо, но не что-то только одно
– Тим Кук стал полагаться на сводки Apple Intelligence из почты
– Apple Intelligence смогла изменить его продуктивность и жизнь
– Он уверен, что использование продуктов Apple тоже изменится
– Apple Intelligence выведет всех на новых технологический виток
– Компания «отказывается от хороших идей ради отличных»
– При этом внутри Apple не считают сами идеи «инновацией»
– Инновацией там считают создание правильного продукта
– Т.е. который можно эффективно использовать в «его время»
– Кук признает, что Vision Pro за $3,5 тыс. – не массовый продукт
– Это для тех, кому нужны технологии завтрашнего дня сегодня
– При этом он отмечает, что «в этом лагере достаточно людей»

@ftsec

606

Нерон

19 Oct, 12:47

А вот как ИИ использует ГТРК “Курган” - оживляет обложки книг

🤓 New Media
📚 Дарим 4 бестселлера

468

Нерон

19 Oct, 12:20

Прикольная видео-шпаргалка, которая показывает, как генераторы видео изображают разные эмоции 😨

Автор делал в Minimax, но +- так же работает и в других генераторах.

569

Нерон

18 Oct, 21:30

Посмотрел новое видео от OpenAI про серию моделей o1 и, как не самая яркая звездочка, последний узнал что o1-mini это не урезанная версия модели (как gpt4o-mini), а версия которую они рекомендуют использовать для написания кода и математики – серьезно, может назвали бы ее o1-dev-math?

В остальном ничего нового – скоро будет поисковик внутри, автоматический выбор модели от сложности задачи, и сама o1 (основная модель, без префиксов)

Видео тут:
https://openai.com/business/solving-complex-problems-with-openai-o1-models/

547

Нерон

18 Oct, 12:04

Мой аишный чемоданчик.

Подумал, вдруг будет полезно собрать для вас инструменты и сервисы, которые я сейчас использую на ежедневной основе. Отсортированы в порядке частоты использования.

Графика:

Ideogram, Adobe Firefly (в Фотошопе), Midjourney, Dalle-3, Phygital+ (там кручу Flux), Krea (для реалтайм генерации), когда нужно что-то поделать в Поломатике1111 - RunDiffusion - позволяет поминутно арендовать любой UI на отличном железе, Magnific для апскейла.

Для работы с текстами:

Claude 3.5, ChatGPT (только из за выхода в интернет), Wispr Flow (отличная приблуда для мака, которая позволяет переводить речь в текст, сейчас практически не пишу, а диктую), Perplexity для поиска.

Видео:

Kling 1.5, Gen-3, Luma. Тут все понятно, пацаны вообще ребята.

Озвучка и звуки:

ElevenLabs, Replay (для аи-каверов).

Говорящие головы:

HeyGen, Hedra.

Монтаж:

Capcut, хоть базово и не совсем аи, но напичкан им.

Если есть какие-то классные сервисы, которыми вы действительно пользуетесь ежедневно, делитесь в комментариях 👍

609

Нерон

18 Oct, 10:07

Простенькое и прикольненькое: на Product Hunt залетел сервис, который поместит на задний фон вашего фото ЛЮБОЙ текст 😱

Это очень трендовая тема на маркетплейсах. С русский языком работает, но поддерживает не все шрифты.

300

Нерон

17 Oct, 17:43

Windows-боги, радуйтесь: OpenAI наконец-то выпустили десктопное приложение и для вас.

Скачать можно отсюда, работает только для владельцев платной подписки.

Там ужасный наплыв желающих, поэтому сайт OpenAI не выдержал и не дает скачать файл.

572

Нерон

17 Oct, 15:46

Adobe провела презентацию, где показала ИИ-фичи для Illustrator. С помощью интеграции нейросетей можно будет одной кнопкой скопировать стиль другой афиши или сделать несколько размеров одного и того же постера 🖕

Вот, где ИИ реально не помешает

297

Нерон

16 Oct, 17:46

У Suno просто сумасшедший апдейт — теперь можно генерировать песни из фотографий или даже из видео.

Под капотом модель, которая анализирует события в файле и подстраивает настроение песни и текст под заданную тему.

Suno приняли свою славу мемо-генератора и развивают ее, но есть одно «Но» — пока работает только в мобильном приложении для iOS, а оно доступно только для США 😣

589

Нерон

14 Oct, 15:28

Adobe выпустил AI для создания видео

Три инструмента для работы с видео уже доступны в режиме бета-теста в Premiere Pro:

Generative Extend — удлиняет видео, добавляя сгенерированные AI кадры
Text-to-Video — генерирует видео по тексту
Image-to-Video — генерирует видео по изображению вместе с текстовым промптом

Максимальная длина клипов - 5 секунд при качестве 720p и 24 кадрах в секунду.

https://www.theverge.com/2024/10/14/24268695/adobe-ai-video-generation-firefly-model-premiere-pro

—
GPT o1-preview и o1-mini уже доступны в c.aiacademy.me.

575

Нерон

14 Oct, 15:22

То, что в бете Фотошопа есть довольно неплохо работающие фичи на базе ИИ — это давно известно, и сейчас они выходят из беты. Но вот то, что в Premiere Pro появилась бета Firefly, позволяющий расширить кадр или прям сгенерировать видео — это, конечно, круто. Буду пробовать.

https://www.theverge.com/2024/10/14/24268695/adobe-ai-video-generation-firefly-model-premiere-pro

526

Нерон

12 Oct, 09:17

Учёные разработали модель, которая в реальном времени генерирует в CS:GO 😱.

Видео генерируется в реальном времени реагирует на ваши команды — поворачивает влево/вправо, стреляет, прыгает и т.д.

До полностью сгенерированных игр осталось пару лет.

618

Нерон

09 Oct, 14:46

Вчера вечером много игрался с новым img2video от https://hailuoai.video:

И это пока лучшая модель по генерации видео из всех доступны — мне кажется они просто на фильмах тренируют, потому что актерская игра там как правило запредельная

И все это (пока) бесплатно, what a time to be alive

390

Нерон

Нерон (Russian)

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон

Нерон