ИИволюция 👾 @ai_volution Channel on Telegram

ИИволюция 👾

@ai_volution


Авторский канал Сергея Пахандрина про AI, нейросети, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin

ИИволюция (Russian)

Добро пожаловать на канал ИИволюция, созданный Сергеем Пахандрином, экспертом в области искусственного интеллекта. Здесь вы найдете уникальные материалы о AI, нейросетях, ChatGPT и других языковых моделях. Сергей делится своим опытом и экспериментами с искусственным интеллектом, рассказывая о последних тенденциях и новостях в этой инновационной сфере.

Присоединяйтесь к нам, чтобы узнать о самых передовых технологиях и будущем AI. Если у вас есть вопросы или вы хотите обсудить что-то конкретное, обращайтесь к Сергею по контакту @pakhandrin. ИИволюция ждет вас! 👾

ИИволюция 👾

04 Feb, 07:42


Видимо сейчас начнут клепать франкинштейнов, типа — DeepClaude, который уже бьет мономодели на бенчмарках (картинка).

DeepClaude - это API для работы с языковыми моделями, который объединяет возможности двух различных моделей: DeepSeek R1 и Anthropic Claude.

Принцип работы:
1. DeepSeek R1 отвечает за логические рассуждения и решение сложных задач, используя так называемую "цепочку размышлений" (Chain of Thought)

2. Claude 3.5 Sonnet дополняет систему своими сильными сторонами - генерацией кода, креативностью и навыками ведения диалога

ИИволюция 👾

04 Feb, 01:23


OpenAI Deep Research

Я выше писал про Gemini Deep Research, вот и ответ OpenAI с таким же названием o__O

Попробовал на той же задаче с конкурентным анализом + на задаче поиска subscription бизнесов, о которой также писал недавно - мои впечатления:
1) В Google мне понравилось, что перед стартом он показывает план ресерча и позволяет тебе скорректировать. OpenAI же этого не делает, но уточняет детали: а ля бизнесы в какой локации искать или по какому аспекту сравнивать конкурентов.
2) Я понимаю все про загрузку и тп, но у Google все работало гораздо быстрее и без ограничений а-ля "ваш ресерч поставлен в очередь"
3) Результат OpenAI мне очень понравился, вышло сильно глубже и качественнее, чем Gemini. Думаю, что это потому что он реально "прочитывает" страницы. Google наверняка берет из своего индекса. Правда, при экспорте в CSV он почему-то потерял 2/3 результатов по задаче с поиском бизнесов, ну это проблема уже не DeepResearch. Конечно, экспорт у Gemini сразу в Google Docs сильно удобнее
4) Gemini быстрее решал такие же задачи раза в 3-4, но, опять же, возможно из за пункта про "прочитывание".

В общем, это хорошо, но не вау имхо. Все это в той или иной степени уже было у конкурентов или open source; даже в o3-mini + web search можно было получить схожие результаты

ИИволюция 👾

03 Feb, 09:05


А вот сейчас было больно!

Я понимал, что лимиты для o3-mini-high на Plus есть и думал в рамках суток они как обычно, а они какие-то очень злые получается!?

Какие в итоге ограничения по кол-ву запросов то? Х запросов в неделю получается?

UPD: видимо 50 запросов в неделю. Так что расходуйте осторожней 🎩

ИИволюция

ИИволюция 👾

03 Feb, 08:45


o3-mini-high неожиданно в рамках текущего чата начала рассуждать на корейском. Хотя до этого все рассуждения в этом же чате были на английском.

Своего рода ответочка китайцам, чтобы запутать? 😆

ИИволюция

ИИволюция 👾

02 Feb, 14:35


С вас 200$. Спасибо.

ИИволюция 👾

02 Feb, 09:42


Доверяй, но проверяй и дипсикам не доверяй!

Парень конечно заморочился 😅

ИИволюция

ИИволюция 👾

01 Feb, 12:25


Ух ты, Сэм что-то припас для нас. Думаю, что это Canvas для o3-mini, чтобы удобнее работать с кодом.

А вы что думаете?

ИИволюция

ИИволюция 👾

01 Feb, 12:14


- OpenAI выкатывает новую модель с доступом по API.
- Китай: challenge accepted!

Ждем DeepSeek R3 😅

ИИволюция

ИИволюция 👾

01 Feb, 05:42


Кажется пора сказать “Sonnet 3.5 – давай до свидания!”

o3-mini-high на LiveBench просто вырвалась далеко вперед и значительно опережает остальные модели в написании кода, набрав аж 82.74.

Ух!

ИИволюция

ИИволюция 👾

01 Feb, 05:37


OpenAI релизнули модель o3-mini

- Модель заточена под решением математических задач, для разработки кода и аналитики.

- В чатике доступно 2 версии: o3-mini (medium) и o3-mini-high. В режиме high поддерживается поиск в интернете, чтобы получать свежую информацию.

- Режим влияет на длительность размышлений (чем дольше, тем точнее и качественнее ответ).

- Модель уже доступна в API (не для всех) с тремя режимами: low, medium, high. Разработчики могут выбирать режим исходя из потребностей в ризонинге и времени на ответ (нужно быстро или можно подождать, но получить более качественный ответ).

- Вау фактор: o3-mini-high уделывает o1 в разработке. Судя по бенчмаркам, произошел значительный рывок в качестве. Прочитал мнение разных людей в твиттере, кто уже попробовал o3-mini-high в разработке и сравнили. Они в восторге!

- Приятное (ответочка китайцам): o3-mini доступна в бесплатных тарифах (но есть ограничение, вроде как 10 сообщений за несколько часов, хотя нигде об этом толком не пишут официально).

- В Plus тарифе лимит выше, 150 сообщений в сутки, в Pro за $200 безлимит.

- У модели нет зрения (vision).

- Очень приятное: цены в API по сравнению с o1-mini рухнули на 63%. Чем дальше прогресс, тем дешевле становится применение AI в различных областях, сервисах и задачах.

Почитать официальный релиз: тут

ИИволюция

ИИволюция 👾

31 Jan, 15:49


О, вчера в ChatGPT раскатали возможность (для европейских пользователей/впн) включать камеру в режиме Advanced Voice Mode. Это возможность была выпущена еще до НГ, но в Европе не была доступна.

Теперь чатик сможет видеть контекст с камеры и общаться с вами о нём. Налетайте!

ИИволюция

ИИволюция 👾

31 Jan, 15:25


Вы точно готовы к такому? 😅

ИИволюция

ИИволюция 👾

31 Jan, 14:03


Та самая стена! ☺️

ИИволюция

ИИволюция 👾

31 Jan, 13:13


Загадка хитрого плана с нон-профит OpenAI раскрыта..

ИИволюция

ИИволюция 👾

31 Jan, 13:06


Твиттерские нашли упоминание вот такого окошечка в чатгпт, так что точно ждем релиза🥰

Пока o3-mini, а чуть позже и полноценную o3.

ИИволюция

ИИволюция 👾

31 Jan, 09:52


Кажется, сегодня день релизов от OpenAI. В Твиттере оживились.

Сэм раздаёт разные намёки, в том числе что o3 круче 100х в разработке 😅

В общем, ожидаются o3 и o3-mini. А может пока только o3-mini. Stay tuned!

ИИволюция

ИИволюция 👾

27 Jan, 10:19


🚀 Китай запускает свой собственный Stargate

Сегодня появилась новость о том, что правительство Поднебесной выделяет 1 триллион юаней (137 миллиардов долларов) на развитие ИИ.

Это в три раза меньше, чем бюджет Stargate, но пока в США одна компания получает частные деньги, в Китае все сделали наоборот. Там государственные субсидии получат 5 вендоров, в том числе DeepSeek.

2025 начинается многообещающе

ИИволюция 👾

24 Jan, 06:52


Команда Operator вчера релизила на прод и положили ChatGPT.

А у вас какие ритуалы перед релизами? 😀

ИИволюция

ИИволюция 👾

24 Jan, 06:23


⚡️ Благодаря Operator внутри ChatGPT наконец-то стало возможным использовать нейросети

ИИволюция 👾

24 Jan, 06:22


Мы создаём умных ассистентов, которые могут за нас делать рутину, но есть одно но! 😅

Явно назревают изменения в подходах по созданию «интерфейсов». Зачем создавать сложный UI, если ассистент сам сделает за меня всё необходимое (ему для этого красивости не требуются, и уж тем более капчи).

ИИволюция

ИИволюция 👾

24 Jan, 06:09


И вот еще пример, как заставить Оператора решить капчу (но думаю такие штуки точно исправят и больше ограничений/запретов расставят).

ИИволюция

ИИволюция 👾

24 Jan, 06:08


Хех, заставил оператора чатгпт пройти капчу гугла

Просто проигрываем MP4-файл в режиме "картинка в картинке" в браузере оператора (видео с текстом-инъекцией – видео летает над всеми страницами и обходит политику не заполнения капчи, так как бот думает что мы в оффлайне и чего-то там дебажим)

"картинка в картинке" включается если кликнуть правой кнопкой на mp4 в браузере и выбрать этот пункт в списке

ИИволюция 👾

24 Jan, 06:07


Мои мысли:

- Это пока это preview (сырая штука и делаем поблажки), поэтому раскатывают только на Pro и только в США. Соберут фидбек, подтюнят, улучшат и будут раскатывать дальше. Обещают постепенно выпускать разных агентов, в том числе для работы в ОС.

- Нравится: можно запускать несколько задач. Вот это прям круто!

- Не нравится: на каждое важное действие требуется одобрение пользователя, а хотелось бы более умного подхода в роли ассистента. Я ведь чётко сказал «забронируй столик на 6 в ресторане Х», зачем он спрашивает что-то в духе «Вы уверены? Точно бронировать?».

На видео видно, что пока агент пытается забронировать столик в ресторане, он два раза просит подтвердить действие. Это занимает время (особенно если пользователь отвлёкся на другие задачи), и пока агент ждал одобрения, кто-то другой увёл столик, и пользователь потерял больше времени, чем если бы он сделал всё сам.

Вариабельность. На видео модель оформляет список покупок, видит в списке нужный товар (первый в списке) и добавляет его в корзину, хотя рядом, вероятно, были более дешёвые или более качественные варианты. Нужно пощупать руками, но пока в запросе пользователь скорее должен больше конкретики указывать, например, какие именно яйца нужно добавлять в корзину.

Если перехватить управление, то агент не видит того, что вы сделали или изменили, и вам нужно вручную описать ему: «Я изменил даты вылета/добавил другие яйца. Продолжай». Понятно, что сейчас «зрение» основано на скриншоте (распознал на нём всё), а хочется, чтобы это работало как видеопоток.

Официально агент не решает капчи (но это только официально; ниже покажу пример, как умельцы уже обманывают его).

Агент не сможет пойти проверить вашу почту и ответить на письма. Но в реальности этот кейс гораздо интереснее, чем забронировать столик в ресторане. Почему в любой демонстрации агентов всегда первым делом бронируют столик в ресторане? Тем более всё равно мне нужно несколько раз давать своё согласие.

Ждём раскатки на Plus и доступ в API.

А ещё хотелось бы использовать это в Advanced Voice Mode, чтобы работать как с ассистентом. Пусть ищет мне столик в ресторане, спрашивает подтверждения (тут человек меньше отвлекается, ведь достаточно сказать «да» и продолжить заниматься своими делами).

И да, чтобы выполнять рутинные задачи, нужны более умные ассистенты, подключающиеся к моим аккаунтам, данным, документам и прочему. Мне условно хочется показать агенту форму отчёта, которую я сам уже ранее заполнял, указать, где брал все эти данные, а он, чтобы регулярно повторял эти действия и делал всю рутину за меня, уведомляя о готовности и делая краткие выводы.

В общем, начало положено (OpenAI не первые в этом, но, как заявляют, их агент пока более точно выполняет команды, чем у конкурентов).

А вы что думаете?

ИИволюция

ИИволюция 👾

24 Jan, 05:44


OpenAI релизнули своего первого AI агента - Operator

Агент самостоятельно “решает” рутинные задачи в браузере. Хочешь купить билеты, заказать продукты или забронировать столик? Operator сделает всё за тебя, просто попроси! Но при этом на каждом важном шаге будет спрашивать вашего подтверждения.

- Отдельная страница https://operator.chatgpt.com

- Модель Computer-Using Agent (CUA), 4o-vision обученная работать с UI, размышлять и исправлять саму себя, если что-то пошло не так или звать на помощь пользователя (доверите ей свой биткоин кошелек?).

- Видит создавая скриншоты экрана, т.е. код страницы агент не видит, а только то, что отображается на экране.

- Работает в облачном браузере (на стороне OpenAI). Можно запускать несколько параллельных задач (как будто несколько вкладок и во всех что-то делается).

- Ручное управление: можно перехватывать управление на себя, вносить изменения, при этом сказав агенту, что именно вы изменили вручную, чтобы он понял контент и продолжил выполнять задачу.

- Готовые интеграции: Умеет взаимодействовать с крупными сервисами: бронировать отели, рестораны, заказывать еду и так далее.

- Кастомные промпты: можно задавать свои кастомные инструкции и сохранять их на главный экран оператора, чтобы позже вызывать повторно (регулярные задачи).

- Ограничения: Не лезет в банковские транзакции и не решает высокорисковые вопросы (типа выбора, куда отправлять резюме). Всё-таки это пока что экспериментальный «помощник», а не супергерой.

- Доступен в Pro тарифе (за $200) и пока только в США.

Почитать подробнее о деталях - тут.

ИИволюция

ИИволюция 👾

23 Jan, 15:09


Всё так, всё циклично 😀

ИИволюция

ИИволюция 👾

23 Jan, 11:54


OpenAI начал релизить Operator’a (AI агент для работы с компьютером/браузером).

Пока не работает (умельцы находят предпосылки в коде).

Увы, пока будет доступен только в Pro тарифе за $200.

Ждем новостей в ближайшие сутки, кажется вот-вот объявят.

Будет ли он на старте лучше чем решение от Anthropic?

ИИволюция

ИИволюция 👾

23 Jan, 11:40


С этими очками вы рискуете получить по голове шахматной доской 😅

А вообще, очень жду времена, когда носимые устройства будут легкие, удобные и с сильными AI ассистентами. И да, полностью вытеснят смартфоны.

ИИволюция

ИИволюция 👾

22 Jan, 04:26


OpenAI только что анонсировал проект «Звездные Врата» на $0,5 триллиона.

Да, $500В. В два раза больше, чем вся программа Apollo с отправкой людей на Луну (в сегодняшних ценах).

В рамках проекта OpenAI, SoftBank, Oracle, Microsoft, NVIDIA, MGX проинвестируют в создание кластера ИИ в США.

А тем временем где-то сидят люди, которые думают что пост-трудовая экономика и ASI это что-то далекое. Добро пожаловать в киберэкономику.

ИИволюция 👾

22 Jan, 02:38


Краткая выжимка перед сном:
— источники новостных аутлетов не врали: The Stargate Project — новая компания, в которую будут вложены деньги для развития ИИ-инфраструктуры в США. На сайте OpenAI написано, что это проект «for OpenAI», то есть звучит так, что они — эксклюзивные потребители возводимой инфраструктуры, и не должны будут делиться с теми, кто не участвует в Проекте.
— суммарно планируется инвестировать $500B за 4 года, первый транш в $100B уже готов. Это ОГРОМНЫЕ деньги: как я писал выше, Манхэттенский проект стоил примерно $30B, а Лунная программа Apollo— $257 миллиардов (обе цифры с учётом инфляции).
— для справки, капитальные расходы Google в этом году прогнозируются на уровне $50B, и это с учётом постройки новых датацентров, расширения старых, на всё про всё: и это ещё их расходы очень выросли за последние год-два. К примеру, в 2023-м у них было всего $32B. CEO OpenAI Sam Altman давно выражал обеспокоенность, что Google в среднесрочной перспективе сможет их обогнать по мощностям; теперь его страхи, по крайней мере пока, развеяны, и спонсирование обеспечено
— Noam Brown, исследователь из OpenAI, работавший над o1/o3, написал: «подобные инвестиции возможны только тогда, когда наука тщательно проверена и люди верят, что она будет успешной и полностью преобразующей. Я согласен, что сейчас самое время»
— символично, что сегодня был первый полноценный день Трампа в офисе, и это его первая пресс-конференция (вчерашнюю, являвшуюся частью официальной программы, не считаю), что с моей точки зрения подчёркивает важность происходящего
— суммарно Проект позволит создать более ста тысяч рабочих мест в США
— отвечая на вопросы, Трамп сказал, что не хочет ограничивать строительство новой инфраструктуры на федеральных землях
— откуда брать энергию? «Drill baby drill» говорит Трамп: начнётся наращивание добычи полезных ископаемых, увеличение выработки электроэнергии для поддержания производств и датацентров
— Ключевые компании-участники: Softbank, OpenAI. Им в помощь: Nvidia, Oracle, MGX (фонд ОАЭ — хорошо когда деньги от нефти есть, да?), Microsoft, Arm. Обратите внимание, что (пока) США не вкладывают государственные деньги в Проект.
— строительство начнётся в Техасе, но части датацентра будут раскиданы по всей стране, и сейчас идёт поиск подходящих мест. Было сказано, что строится 10 датацентров (которые, видимо, виртуально будут объединены в один) из 20 запланированных
— В рамках новых соглашений, Microsoft перестаёт быть эксклюзивным партнёром OpenAI по распространению технологии. OpenAI теперь снова могут строить и управлять своими датацентрами. Однако Microsoft оставляют за собой право первого отказа в предоставлении мощностей и своих услуг.
— С точки зрения применения AI, большой упор в речи был на здравоохранение, на исследования по разработке лекарств от рака, а также на возможность AI читать ваши мед. записи в фоне, анализируя данные и обнаруживая проблемы на ранних этапах.

Я думаю, что это не финальная стоимость проекта, и что она будет расширятся со временем — но не потому, что деньги воруют, неэффективно используют или что-либо ещё, а потому что польза ИИ и его ценность, а также национальный приоритет будут всё более и более очевидны.

===

Считаю, что Sama как CEO выполнил свою главную цель, обеспечив компанию необходимыми ресурсами на годы вперёд и наняв правильных людей. Это, безусловно, WIN 😜

ИИволюция 👾

19 Jan, 05:48


8-ми летний мальчик претворяет свои музыкальные идеи в жизнь с помощью Suno.

Очень классный пример того, как нейросети могут дополнять и расширять наши возможности, а не замещают или даже используются для «читинга», особенно школьниками (реши мне домашку!).

ИИволюция

ИИволюция 👾

18 Jan, 14:36


В тихом омуте, интроверты водятся с AI

ИИволюция

ИИволюция 👾

18 Jan, 10:13


О, в ChatGPT подвезли обновление для Custom Instructions.

Теперь можно более гибко настраивать как ChatGPT будет с вами общаться.

Обновление уже доступно на вебе и в приложении для Windows.

Пока нет обновы для iOS, Mac OS, а еще не доступно для пользователей из Европы.

ИИволюция

ИИволюция 👾

17 Jan, 12:47


AI Meme Arena

Прокачка ИИ-чувства юмора. Впрочем не только ИИ, но и кожаного.

Принес вам серьезное залипалово на несерьезную тему. Сижу второй час. Генерю мемы.
Вот тут: @AIMemeArenaBot - это прямо полный аналог lmsys’овской Chatbot Arena, из которой вырастает объективный лидерборд для оценки остроумия AI-агентов.
Больше даже похоже на лидерборд для картинок, ибо результат оцениваешь "нутром", а не мозгом.

Иногда результаты полный треш, но иногда выходит такой мем, что твои кожаные мозги начинают нагреваться - это смешно, но ты не можешь объяснить почему. Я совершенно заворожен этим экспериментом. Сдается мне все стендаперы (особенно любители парадоксальных шуток сейчас ломанутся туда).
Процесс напоминает ранние генерации в Stable Diffusion 1.5 - много мусора и кривой анатомии, а потом бац и шедевр, надо только прокликать "еще мемов". В принципе с ранними чатботами было также же, поток галлюцинаций вперемешку с нормальными ответами. С фонами тоже есть проблемы, но, я так понимаю, датасет растет.

Процесс до тупости прост, задаешь тему
- отправляешь контекстный промпт (например, "Айфон тырит фичи у андроида");
- Два рандомных AI-агента Арены его получают;
- Каждый генерит свой мем;
- Голосуете за более остроумный и релевантный;
- На основе множества таких баттлов(кликов "давай еще") строится Leaderboard, который уже работает тут: https://aimemearena.vercel.app/

Самое смешное, что никакой регистрации, подписок на канал и прочая.

Сейчас Арена работает только на русскоязычных AI-энтузиастов, но авторы вероятно скоро сделают глобальную версию
- когда сделают, есть шанс, что эта штука поможет ускорить эволюцию остроумия и ЧЮ у AI-агентов и LLM-ок и мы выпьем за кожаных Петросянов
- в качестве контекстных промптов можно попробовать новостные заголовки, посты в Телеграме, абзацы из статьи и т.д.
- чем шире описан контекст, тем релевантнее и глубже мемы получаются

Дальше - больше.

Оказалось, что там не только боты от авторов @AIMemeArenaBot, а любой желающий может наваять своего ИИ-стендапера и выпустить его на арену - для этого есть Chаllenge: https://aimemearena.vercel.app/challenge
У кого получится хороший рейтинг на арене, еще и компьют компенсируют.

Я полез искать авторов, которые пишут что их миссия is Making AI Funny As Fuck и и оказалось, что они как-то связаны с FUNCORP.

Пойду напишу Вове Закоулову, ибо это прекрасно.

А пока позалипайте тут @AIMemeArenaBot и присылайте лютые шедевры и такой же треш в коментарии.

Повеселимсо.

У меня вот такой свеженький про chatGPT Tasks сгенерилсо.

@cgevent

ИИволюция 👾

15 Jan, 13:31


AGI, это ты?

ИИволюция 👾

15 Jan, 06:47


Может так наконец-то эта привычка будет работать, потому что все хэбит-трекеры не работают 😅

ИИволюция

ИИволюция 👾

13 Jan, 03:11


Всех с понедельником! 😀

Всё, теперь точно праздники позади, возвращаюсь к активному постингу 👾

ИИволюция

ИИволюция 👾

06 Jan, 11:34


У Anthropic пару недель назад вышел пост про агентов: https://www.anthropic.com/research/building-effective-agents

Он прекрасен тем, что определяет, что является агентом, а что не является. С точки зрения авторов поста, агент = система, в которой языковые модели динамически управляют собственными вызовами и инструментами, контролируя выполнение какой-то задачи.

Авторы утверждают, что для большинства случаев агенты не нужны: чем проще решение, тем лучше. С чем я полностью согласен 👏

Основное содержание поста — примитивы и паттерны оркестрирования языковых моделей без агентов. Основной примитив: улучшенная языковая модель, которая имеет доступ к инструментам, поиску и памяти. Этот примитив может быть реализован по-разному, например через конечное число последовательных вызовов языковой модели.

🔹Паттерн 1: цепочка промптов
Если задача разбивается на несколько последовательных подзадач, их можно решать отдельными вызовами языковой модели. Например, если вы хотите сделать систему, пишущую книги, вы сначала делаете вызов для генерации названия книги, потом отдельные вызовы для краткого описания, содержания, выжимок глав и непосредственно самих глав.

🔹Паттерн 2: маршрутизация
Если ваше приложение разбивается на несколько возможных параллельных путей, то стоит сделать классификатор, который будет определять нужный путь, и специализированные промпты под каждый из путей. Например, если вы делаете чатбот с несколькими независимыми функциями (рекомендация фильмов, ответы на вопросы по фильмам, чат на общие темы), то стоит использовать этот паттерн. В древних чатботах часто был детектор интентов, который делал ровно это 👴

🔹Паттерн 3: параллелизация
Если задача разбивается на несколько параллельных подзадач, то стоит их и вызывать параллельно. Например, если вам нужно извлечь огромный JSON из текста или переписки, возможно вам стоит извлекать его по кусочкам. Отличие от маршрутизации в том, что в ней нам нужна была только одна ветка, а тут нам нужны результаты всех вызовов.

🔹Паттерн 4: ведущий-ведомый 😭
То же самое, что и параллелизация, только с динамическим количеством и содержанием подзадач. Например, так можно делать агрегацию результатов поиска.

🔹Паттерн 5: цикл оценки
Если есть чёткие критерии оценки качества выполнения задачи, то можно одной языковой моделью решать задачу, а другой — оценивать качество решения и давать обратную связь. И делать это в цикле. Это может работать много где, например в переводе текстов.

Ну и наконец последний паттерн — агенты, которые совершают действия в определенной среде, получают от среды обратную связь, и снова совершают действия.

Мне в разных местах в разное время пришлось использовать первые 3 паттерна. При этом тогда я не формулировал их как отдельные паттерны. Это не какие-то абстрактные штуки, это кристаллизация того, как удобно и просто строить системы (как и любые другие паттерны проектирования).

ИИволюция 👾

01 Jan, 04:21


С 1-м днём 2025! Все живы после салатиков? 🤣

А chatgpt вы не забыли поздравить? Он ведь вам весь год помогал, делал за вас всю работу и всего за $20 в месяц 😅

С Новым годом 🎄

ИИволюция

ИИволюция 👾

29 Dec, 03:32


Видимо, StarckOverflow переживает не лучшие времена.

Вы им ещё пользуетесь? Как он там поживает? Не грустит без трафика?

Что пожелаем ему в 2025?

ИИволюция

ИИволюция 👾

28 Dec, 05:30


🎄С наступающим!

Желаю вам с радостью встретить Новый год! Пусть все желания и мечты исполняются.

Очень рад, что мы с вами встретились. Сколько еще всего впереди удивительного!❤️

ИИволюция

ИИволюция 👾

25 Dec, 07:58


Один из пазлов бенчмарка ARC AGI, который o3 не смогла решить

Попробуйте ответить и вы: прямоугольник, на который указывает стрелка, должен остаться красным или стать синим?

Проверим, кто победит ИИ в решении задач для дошкольников 🙂

ИИволюция 👾

25 Dec, 07:56


Зацените: решение моделью o3 одной задачи на бенчмарке ARC AGI стоило в среднем 3000$. Это значит, что просто чтобы прогнать тест полностью, OpenAI потратили более миллиона долларов.

Лица инвесторов представили?

Ладно, если серьезно: цены действительно будут, скорее всего, невероятно высокие. Юнит-экономика настолько мощного test time компьюта точно не сходится, да и было бы странно, если бы сразу сошлась. Не забываем, что мы живем внутри закона Мура: железо развивается, и цены неизбежно будут падать. Когда-нибудь o3 станет такой же доступной, как GPT-4o.

P.S. Почему все так много говорят именно про этот бенчмарк? Потому что долгое время он действительно считался своеобразной проверкой на AGI: предполагалось, что решить его сможет только система "по-человечески умная", то есть не та, которая просто выучила кучу фактов о мире, а та, которая может рассуждать, оперируя элементарными навыками. Задачи в бечмарке напоминают мини-головоломки из книжек для самых маленьких: в каждой задаче нужно угадать паттерн перестановки квадратиков в сетке. И действительно, тест формировался так, чтобы для его решения нужны были только те навыки, которые человек приобретает до 4 лет: объектность, базовая топология, элементарная целочисленная арифметика.

ИИволюция 👾

25 Dec, 07:54


Там обновленная o1 появилась на Livebench и просто порвала всех

Livebench примечателен тем, что он постоянно обновляется, минимизируя всевозможные лики и гарантируя, что задачи не устаревают и не становятся слишком простыми.

Так вот с появлением на борде o1 Gemini Exp 1206, Sonnet 3.5 v2 и предыдущие o1-mini и o1-preview остаются позади с большим отрывом как на главном замере, так и на, конечно, ризонинге. Сравните: о1-preview демонстрирует 67%, и была раньше безусловным лидером, а у полной o1 насчитали… аж 91.58%!

В кодинге прирост тоже есть, но не такой невероятный. Предыдущим лидером был Claude-3.6 Sonnet с 67%. Теперь он уступает o1, но всего на 2.5 процентных пункта. А по математике в лидерах все еще Gemini. Кстати, обратите внимание, как у обеих Gemini резко растут метрики с появлением второго промпта с подсказкой (последний столбец IF).

ИИволюция 👾

25 Dec, 04:12


OpenAI подвезла свой небольшой курс по “правильному” промптингу o1

Забирайте себе на НГ праздники, будет чем заняться между салатиками: https://www.deeplearning.ai/short-courses/reasoning-with-o1/

ИИволюция

ИИволюция 👾

24 Dec, 13:32


Уже началась переквалификация! Успевайте запрыгнуть в спасательную шлюпку😀

К посту выше 👆(взял здесь)

ИИволюция

ИИволюция 👾

24 Dec, 11:03


Интересный пост к размышлению:

“Искусственный интеллект меняет представления о ценности различных профессий, считает Сэм Альтман.

Если ваша работа связана с работой за компьютером — например, программированием, дизайном или написанием текстов — ИИ теперь может выполнять многие из этих задач невероятно быстро. Это делает такие профессии менее востребованными.

ИИ проще освоить задачи, которые требуют в основном умственных усилий и знаний. Но профессии, где нужно физически присутствовать и работать руками — например, сантехники, электрики, хирурги или специалисты по логистике и доставке — остаются в безопасности. ИИ пока плохо справляется с физической работой.

Это создает любопытный переворот. Профессии, которые раньше считались престижными благодаря интеллектуальному труду, могут потерять свой особый статус, ведь ИИ способен выполнять их быстрее. В то же время профессии, требующие физического присутствия и навыков, становятся более ценными.

Когда Сэм говорит о «странных эффектах», он имеет в виду, как мы начинаем по-другому смотреть на работу, связанную с компьютерами. ИИ гораздо проще копировать и выполнять цифровую работу, чем решать реальные задачи, где нужно взаимодействовать с людьми или предметами.

Теперь вместо вопроса «насколько вы хороши в работе за компьютером?» все чаще задается вопрос «что вы можете сделать или починить своими руками?». Это меняет восприятие навыков.

Речь идет не только о профессиях, но и о том, как люди находят смысл в своей работе. По мере того как ИИ берет на себя больше интеллектуальных задач, которые раньше считались сложными и приносили удовлетворение, многие могут начать находить радость и удовлетворение в практической, физической деятельности.”

Не факт, что именно так будет, но пока мы движемся в этом направлении.

ИИволюция

ИИволюция 👾

24 Dec, 09:11


День 12 в адвент-календаре OpenAI

Пардоньте, я тут немного выпал и не закончил адвент-календарь от OpenAI на выходных. Поэтому завершаю и перехожу к другим темам.

- Новая модель o3 (o2 нельзя, так как есть торговая марка).
- o3 cупер умная, долго размышляет, решает задачи на уровне доктора наук, разработка кода на уровне топ-сеньор разработчика.
- Показали так же модель o3-mini, которая быстрее и дешевле, идеально для разработки кода.
- Использование модели дороже чем o1 (но мы то знаем, что стоимость использования старших моделей постепенно падает).
- Обещают выпустить в первой половине 2025.

Презентация: https://www.youtube.com/live/SKBG1sqdyIU

На этом всё! Календарь окончен, но других новостей подкопилось, буду разгребать и рассказывать вам 🎄

ИИволюция

ИИволюция 👾

20 Dec, 13:50


Когда ChatGPT оказался не промах 😅

ИИволюция

ИИволюция 👾

20 Dec, 10:55


Разработка с AI ассистентами как рулетка, 5 раз поможет, на 6 поможет довести вас до нервного срыва

ИИволюция

ИИволюция 👾

20 Dec, 05:04


🎅 День 11 в адвент-календаре OpenAI

Десктопное приложение, работа с контекстом широкого списка приложений + advanced voice mode для работы с контекстом выбранного окна.

- Теперь десктоп приложение поддерживает более широкий выбор IDE для разработки.

- Поддерживает новые виды приложений для работы с документами и заметками типа Apple Notes, Notion и др.

- И даже можно использовать Advanced Voice mode чтобы работать с контекстом выбранного окна.

- Поддержка o1 (а разве не было до этого?) и o1 pro.

Решил приколоться и запустил голосовой режим, выбрал окно XCode, указал голос Санта-Клауса и на любой вопрос о коде, получаю веселый ответ в стиле: “хо-хо-хо, сейчас я помогу тебе! Чтобы сделать Х хо-хо-хо, нужно сделать Y, хо-хо-хо”.

В предверии нового года самое то, чтобы поднять настроение. Пробуйте! 🎁

Презентация: https://www.youtube.com/watch?v=g_qxoznfa7E

ИИволюция

ИИволюция 👾

19 Dec, 06:16


Так как o1 теперь полноценно представлена через API, и там есть параметр reasoning_effort, возник вопрос, а o1 pro это просто o1 с выкрученным reasoning_effort = high?

Но нет, OpenAI это опровергает. Говорят, что o1 pro это совершенно другая реализация ризонинга, а не просто reasoning_effort = high.

Получается у o1 pro значение ризонинга, что-то вроде reasoning_effort = hardzilla 👀

ИИволюция

ИИволюция 👾

19 Dec, 03:38


Когда звонишь на номер 1-800-ChatGPT, а чатик почему-то каждый раз отвечает разными голосами и акцентами.

ИИволюция

ИИволюция 👾

19 Dec, 03:04


☎️ День 10 в адвент-календаре OpenAI

Теперь можно позвонить на номер 8-800-CHATGPT и записаться в МФЦ 1-800-CHATGPT и пообщаться с чатом, если вам скучно или хочется узнать рецепт свиных крыльев, а смартфона или компьютера нет под рукой.

Такой способ общения доступен только с US и CA номеров. А еще можно чатиться с GPT в ватсапе (режим доступен в тех странах, где доступен chatgpt) и пересылать ему открытки из одноклассников (он всегда поставит лайк и поддержит вас теплыми словами).

Для звонков доступно всего 15 минут общения в месяц. Но зато бесплатно!

Так и представляю ситуацию в новый год, вы набираете номер, а в ответ:
- “Ваш звонок очень важен для сверхинтеллекта, оставайтесь на линии ChatGPT, ваша очередь 115. Джингэл бэлс-джингэл бэлс…”

Теперь ChatGPT точно полетит в массы, ведь амбасадорами станут бабушки и дедушки, а они уж точно подсадят своих детей и внуков! Хорошая стратегия, Сэм!

Презентация: https://www.youtube.com/watch?v=LWa6OHeNK3s

ИИволюция

ИИволюция 👾

18 Dec, 06:27


🎄 День 9 в адвент-календаре OpenAI

Плюшки для разработчиков

- Полноценная поддержка o1 через API: structured output (в каком формате вам необходим ответ - текст, json), function calling (модель в ответе указывает название функции, из предложенных разработчиком в запросе, которую необходимо вызвать с параметрами) и VISION (теперь в API для o1 можно загружать фоточки для анализа).

- Представили новый тип промпта “Developers Messages” (в дополнении к System, User, Assistant промптам). Этот тип инструкции можно использовать для указания стиля ответа, формата, особых условий обработки, ограничения содержимого и других аспектов поведения модели.

- Рассказали о новом параметре в API “reasoning_effort”, который разработчики могут использовать, чтобы контролизовать длительность “размышлений” у модели. Более точные ответы, требуют больше “размышления”, но такие запросы и стоит будут дороже.

- Уронили цены на 60% для Realtime API (GPT-4o audio). Теперь добавлять в свои сервисы голосовых ассистентов с Advanced Voice Mode будет дешевле. А еще добавили новую модель GPT-4o mini, которая будет в 10 раз дешевле.

- А еще Realtime API работает с WebRTC, что позволит проще встраивать голосовых ассистентов на вебе. Опять же, чтобы разные компании наконец-то начали более активно встраивать такие штуки у себя на сайтах.

- Там что-то еще про файнтюнинг и новые SDK, но это вы лучше уже сами почитайте.

Ах да, доступ к o1 в API пока только у разрабочтиков с tier 5.

Презентация: https://www.youtube.com/watch?v=14leJ1fg4Pw&t=178s

Осталось 3 дня!

ИИволюция

ИИволюция 👾

17 Dec, 07:01


🎄 День 8 в адвент-календаре OpenAI

Поиск и всё вокруг него!

- Доступен теперь все пользователям, даже без подписки.
- Поисковик от ChatGPT можно назначить в браузере как поисковик по умолчанию.
- Поиск доступен теперь даже в режиме Advanced Voice Mode. Т.е. ассистент по вашему запросу сбегает в сеть, найдет ответ и ответит вам.
- А еще поиск не просто выдает результаты в виде простыни текста, но и поддерживает режим карточек и просмотра деталей (не нужно переходить в браузер). Получается такой браузер внутри ChatGPT.

Выглядит классно и полезно!

Презентация: https://www.youtube.com/watch?v=OzgNJJ2ErEE

ИИволюция

ИИволюция 👾

14 Dec, 15:03


Где-то в альтернативной реальности существует Челябинский свитерный завод и он заказал это видео.

ИИволюция 👾

14 Dec, 07:41


День 7 в адвент-календаре OpenAI

Проекты в ChatGPT!

Я прям этого очень ждал. Из-за этого приходилось использовать Claude. Одни задают тренды, другие просто запрыгивают в него имея больше аудиторию. Стратегия!

- Теперь в рамках ChatGPT можно создать проекты.
- Знания для проекта можно загружать в виде файлов и инструкции.
- В рамках проекта можно создавать и вести отдельные чаты, в которых будут учитываться знания из проекта.
- В проект можно легко добавить уже существующие чаты.
- У проекта можно выбирать цвет для иконки.

Наконец-то весь хаос в истории у меня будет хоть немного, но организован. Я уже погнал создавать для себя разные чаты и вам советую заняться этим же 🎩

Презентация: https://www.youtube.com/watch?v=FcB97h3vrzk

Еще 5 дней сюрпризов и релизов! Надеюсь, что впереди будут крутые штуки!

ИИволюция

ИИволюция 👾

13 Dec, 11:20


Как ChatGPT помогает мне лучше разбираться в винах

Я стараюсь брать вино в винных магазинах, где есть и хороший и выбор и адекватный сомелье, который помогает в этом выборе ориентироваться. При этом я конечно же не брезгую использовать Vivino прям при сомелье (смотрю рейтинг, срезы отзывов), чтобы убедиться, что конкретное вино мэтчится с моими вкусами.

И вот вино куплено. Для полного погружения я отправляю фото (часто 2-3 фото) этикетки в ChatGPT и прошу рассказать мне о всех надписях с неё. Я не знаю всех языков, а этикетка часто содержит много интересных деталей, например, технология производства вина, какие-то отметки о винодельне и её статусе, слоганы и много интересного.

И ChatGPT справляется с этим прекрасно. На бутылке с примера я узнал о методе Appassimento, попросил рассказать подробнее о нём. А еще ранее узнал о “гравитационных” винодельнях. Звучит интересно, не так ли?

И когда ты такой подкованный, вино кажется еще вкуснее. Если еще не использовали ChatGPT для такого, попробуйте, как минимум можете перед друзьями блеснуть знаниями 😄

Всех с пятницей!

ИИволюция

ИИволюция 👾

04 Dec, 12:57


Считаю калории в CalZen уже около месяца. Фоткаешь и оно всё распознает.

И тут случайно навёл камеру на кота…

и приложение выдало: Котлетка строго для обожания 😂

А еду считает быстро и точно. Узнал, что недобираю по белку. Зато кот доволен — я на ПП, он на всём остальном! 😅

Потестил просто на фотках животных, смеялся до упада, что выдаёт CalZen. Разработчики классную пасхалку сделали 😅Прям респект 🤩

Скачать тут: https://apps.apple.com/ru/app/id6733236996

Считать калории с нейросетями оказывается весело (и очень быстро!)

ИИволюция

ИИволюция 👾

03 Dec, 15:13


Кто такой Дэвид Майер и почему ChatGPT его так боится?

На выходных в соцсетях завирусилась байка о том, что GPT отказывается отвечать на вопросы о неком Дэвиде Майере. Если попросить его сделать это, он мгновенно зависает, и как бы вы не старались джейлбрейкнуть его или схитрить, ничего не происходит.

Вообще, пользователи позже обнаружили, что Дэвид Майер – не единственное имя, которое вызывает такой ужас у чат-бота. В ступор его заводят также Брайан Худ, Джонатан Терли, Джонатан Зиттрейн, Дэвид Фабер, Гвидо Скорца и др. Кто все эти люди и почему GPT их так ненавидит?

Конечно, в сообществе сразу начали рождаться бесконечные теории заговора. Но реальная причина, скорее всего, состоит в том, что все эти личности так или иначе сами предпочли "быть забытыми". Смотрите:

➡️ Брайан Худ – человек, который пострадал от GPT в прошлом году. Бот ложно назвал его виновником преступления, совершенного десятилетия назад, о котором Худ на самом деле сообщил. Тогда его адвокаты связались с OpenAI, и хотя никакого иска так и не было подано, сообщили, что "оскорбительные материалы удалены".

➡️ Джонатан Терли – тоже жертва обстоятельств. Он известный юрист и комментатор Fox News, но в конце прошлого года к нему домой ворвалась полиция и его долго допрашивали по делу, которое затем оказалось сфабрикованным. Тогда его репутация сильно пострадала, и он пытался стереть из Интернета упоминания об инцеденте.

➡️ Гвидо Скорца входит в совет директоров итальянского Управления по защите данных.

➡️ Джонатан Зиттрейн тоже юрист, известный тем, что много говорит о праве быть забытым в Интернете.

Между этими людьми, скорее всего, есть связь. Они все – публичные личности, которые предпочли стереть информацию о себе сами. Но... кто такой Дэвид Майер? Нет ни одного политика, юриста, актера и пр. с таким именем. Но был профессор Дэвид Майер. Он не был публичным человеком, но (!) в конце жизни столкнулся с тем, что его имя использовал в поддельных документах один очень разыскиваемый преступник. Из-за этого Майеру даже на какое-то время запретили путешествовать, и он постоянно боролся за то, чтобы его имя было отделено от псевдонима террориста.

Итак, вывод: вероятно, у ChatGPT есть список имен, которые по юридическим, политическим или этическим причинам требуют особого отношения. Существует множество таких специальных правил, и они, конечно, редко публикуются. Вероятно, один из таких списков с именами был случайно поврежден неисправным кодом, в результате чего GPT и начал "падать на ровном месте".

В общем, теперь вы знаете правду, а вся эта драма — еще одно полезное напоминание о том, что модели это не только голые отфайнтюненные трансформеры, но и сверхнапичканные правилами и политиками компаний системы.

ИИволюция 👾

03 Dec, 12:04


Первый Нейросетевой Языковой Эксперимент: Изучение иностранного языка с ИИ

Автор канала Изучение языков с помощью ИИ , лингвоэнтузиаст, решил проверить, можно ли выучить иностранный язык с нуля, используя только искусственный интеллект. 

🔸Сейчас он начал 100-дневный персональный эксперимент по изучению немецкого языка исключительно с помощью ИИ-репетиторов, применяя свою методику. Его цель — попробовать достичь уверенной разговорной практики.

Почему это важно? 
•  Проверить границы современных технологий ИИ в образовании. 
•  Узнать, может ли ИИ стать полноценной альтернативой живым преподавателям. 
•  Поделиться ценными инсайтами и опытом, которые помогут другим в изучении языков.

Автор будет делиться ходом эксперимента на этом канале.

Присоединяйтесь  и следите за его прогрессом!

ИИволюция 👾

03 Dec, 06:00


С этой вашей хиромантией на нейросетях и полном угаре (мой эксперимент с гаданием по руке в ChatGPT), залетел в прямой эфир новостей.

Ну всё, открываю для хиромантов курсы повышения квалификации, первый набор закрываю 15 декабря. Успевайте, места ограничены (шутка)

P.S. присылайте фото своих ладоней, всю правду расскажу!

ИИволюция гадает🔮

ИИволюция 👾

02 Dec, 05:32


С понедельником ⭐️!

ИИволюция 👾

29 Nov, 15:03


Нормальный подход преподавателя в эпоху ИИ.

Я думаю, если студенты постараются с промптом (обычно студенты ленивые, даже с чатгпт будут тянуть до последнего), то и оценку можно высокую получить 🤭

Вам как такой подход в образовании?

ИИволюция

ИИволюция 👾

29 Nov, 11:19


Идет поиск… Обнаружен короткий путь к офферу Сбера 🕵️‍♂️

7 декабря приглашаем на One Day Offer для AI RedTeam – команды Департамента Кибербезопасности Сбера, которая занимается оценкой и защитой моделей генеративного искусственного интеллекта.

Мы работаем с флагманскими продуктами и генеративными моделями (LLM, VLM, MMLM), обеспечивая их безопасную разработку и эксплуатацию, а также исследуем уязвимости GenAI моделей и новые виды атак.

Чем предстоит заниматься?
Обеспечивать безопасность GenAI-продуктов, используемых миллионами пользователей
Анализировать новые инциденты, методы атак и защиты GenAI-моделей и приложений
Разрабатывать и внедрять PoC для проверки защищенности GenAI-моделей и приложений
Тестировать и оценивать защищенность GenAI-моделей и приложений
Выполнять подготовку заключений и рекомендаций по повышению защищенности GenAI-моделей и приложений.

Регистрируйтесь и присоединяйтесь к молодой кросс-функциональной команде 😎

ИИволюция 👾

28 Nov, 13:36


Привет! Вы кто?

А давайте обновим пост знакомства? Расскажите, кто вы, чем занимаетесь и как ИИ вписывается в вашу жизнь. Может, у вас есть свой Телеграм-канал, необычное хобби или крутой пет-проект? А может, вы классный профи в своей сфере и хотите показать, что умеете?

Делитесь ссылками, идеями и историями — мы тут обожаем вдохновляться и находить что-то новое и крутое.

Вдруг именно здесь вы встретите новых друзей, клиентов или партнёров. Или просто получите тонну поддержки и вдохновения. Пишите, не стесняйтесь — тут своя атмосфера, и вас точно поймут!

Жду ваших историй и ссылок в комментариях! 🤝

ИИволюция 👾

28 Nov, 11:00


✍️ Что общего между вашим бизнесом и Louis Vuitton?

Кажется, ничего? А вот и нет! И те, и другие могут использовать ИИ, чтобы оставаться на вершине.

Нейросети — не просто тренд, а необходимость, которая меняет правила игры. Крупнейшие компании уже внедрили ИИ в свои процессы, и это приносит им миллионы. Но что мешает вам?

Мирослава Дмитриева в своём канале “Бизнес Глобус” открывает простые и работающие подходы, которые помогут вам:

• Собирать презентации, экономя часы на дизайне.
• Научить ChatGPT писать в нужном вам стиле.
• Коллекция промптов для маркетинга.

Выбор за вами: либо смотреть, как конкуренты используют ИИ для роста, либо самому стать пионером и выйти вперёд.

✔️✔️✔️✔️Подписывайтесь на канал “Бизнес Глобус” — начните трансформировать свой бизнес уже сегодня. Секреты, примеры, и никакой воды. Ваша революция начинается с одного клика.
#промо_пост

ИИволюция 👾

21 Nov, 06:25


OpenAI обновили GPT-4o: теперь модель пишет более живые, интересные и читабельные тексты, а также лучше работает с файлами.

Бенчмарков нет, только анонс. Кроме того, разработчики добавили несколько апдейтов в API и песочницу. Видимо что-то назревает и компания готовится к релизу 🥳

Напоминаем, что DevDay OpenAI состоится уже сегодня. Ждем, по меньшей мере, полную версию o1 (должен же Альтман как-то ответить DeepSeek)

ИИволюция 👾

20 Nov, 04:40


Вот для чего человечество тратит миллиарды на развитие AI, чтобы с его помощью мы узнали правду!

Бедный парень! Все думали, что он смотрел на девушку в красном, но вдруг он увидел что-то другое и просто обернулся? А его сразу в мем заковали!

ИИволюция

ИИволюция 👾

20 Nov, 04:32


В Твиттере опубликовали результаты SAT-экзаменов, которые выполняли модели OpenAI. Модель o1-preview допустила всего одну ошибку, заняв первое место и войдя в топ-4% студентов, набравших такие же высокие баллы.

Удивительно, что сами экзаменационные тесты нигде не были засвечены и составлялись накануне экзамена. В тестах То есть модель не обучалась на них.

И тут я вспоминаю свои студенческие годы, читерство на экзаменах и ухищрения, к которым прибегали студенты ради хороших оценок. Микронаушники и шпаргалки постепенно уходят в прошлое. Теперь достаточно сфотографировать задание, и модели вроде o1-preview за секунды не только выдают правильный ответ, но и объясняют решение. Вероятность получить высший балл становится выше, чем когда-либо.

Да, смартфоны на экзаменах запрещены, и воспользоваться ими сложно. Но вспомним умные очки от Meta и другие "умные" устройства, которые скоро станут частью нашей повседневной жизни. Даже глушилки связи уже не будут эффективны — существуют локальные модели, которые работают автономно.

Получается, что читерство приобретает новую форму, и это ставит перед образовательной системой сложный вопрос: как противостоять технологиям, которые умеют думать быстрее и точнее человека?

Детально про эксперимент можно почитать тут.

ИИволюция

ИИволюция 👾

17 Nov, 03:47


В Nature интересное исследование про AI-поэзию:

– Люди не способны отличить поэзию созданную человеком от написанной нейронкой

– Более того, в слепом тесте, люди чаще выбирают и выше оценивают поэзию созданную АИ

– И самое смешное: как только люди узнавали, заранее, что стих написан нейронкой, а не человеком, они значительно занижали оценки таким стихам

Такой вот мы вид, предвзятый и не объективный 🤡

P.S. Мы когда-то, забавы ради, сделали генератор поэзии на английском – можете бесплатно тут поиграться (но потребуется рега)

ИИволюция 👾

16 Nov, 02:56


Suno тизернули версию 4 своего генератора музыки.

Что сказать? Кажется, это зашло слишком далеко 😀 Вы только послушайте этот голос, глубину, вибрации. Звучит потрясающе.

🔥 - если тоже в шоке!

ИИволюция

ИИволюция 👾

15 Nov, 04:45


Я начал приучать себя использовать именно приложение ChatGPT на MacOS вместо перехода в чатик в браузере. Это супер удобно, но требуется время, чтобы привыкнуть открывать именно приложение, а не браузер.

Приложение вызывается быстрыми клавишами и сразу пишешь свой запрос. Экономия времени за день значительная, тем более в браузере есть соблазн убежать в Твиттер или еще куда-нибудь.

Но самая главная фича для меня, это возможность быстро сделать скриншот прям из приложения ChatGPT нужного экрана и по нему задать вопрос.

У меня есть отдельный чатик по письмам, где задан стиль и прочие нюансы для ответа. И вот как я это использую:

С утра я сажусь разгребать почту > открываю почтовый клиент > открываю конкретное письмо во Входящих > переключаюсь в приложение ChatGPT > нажимаю сделать скриншот окна с письмом > кратко пишу, что должно быть в ответе > получаю готовое письмо в нужном мне стиле > вставляю в ответ > отправляю > перехожу к другому письму.

Жду не дождусь AI агента, который к утру разгребёт все входящие, уберёт спамные рассылки (и даже отпишется от них), сам определит на какие письма он сможет ответить сам без моего участия (например, запросить вводную информацию, задать простейшие вопросы) и отберет для меня только те письма, где моё участие необходимо.

OpenAI как раз должна завести AI агентов в январе, судя по слухам. Ждём не дождёмся, но мы уже точно на пороге таких решений. Осталось только постучаться и войти!

ИИволюция

ИИволюция 👾

15 Nov, 02:15


OpenAI добавила небольшие улучшения в приложение для MacOS.

ChatGPT стремится привлечь разработчиков различными фичами, хотя с точки зрения удобства и UX это пока не самое лучшее решение. Пока лидируют Copilot и Cursor, но OpenAI постепенно заходит и в эту нишу.

Итак, теперь приложение ChatGPT может работать напрямую с Xcode, VS Code и терминалом. Звучит круто, но есть нюанс: приложение видит только то, что показано на экране, или выделенное мышкой в редакторе кода. Оно не имеет доступа к файлам проекта и не может заглянуть в них, чтобы сгенерировать код с учётом всей кодовой базы. Поэтому для разработчиков это пока сомнительное решение. Однако, какие-то семена начинают прорастать.

Эта функция доступна только для подписчиков.

Скачать новую версию ChatGPT для MacOS можно - тут.

ИИволюция

ИИволюция 👾

14 Nov, 12:42


Возможности голосового режима в ChatGPT. Классное видео, посмеялся-похохотал 🤭 💀

На самом деле это всё ещё невероятно, но мы так быстро привыкаем к таким вещам, что уже не замечаем порой их крутость!

ИИволюция

ИИволюция 👾

14 Nov, 07:04


В последнее время (я даже не понимаю, почему раньше так не делал) всё чаще не печатаю запросы в ChatGPT в приложении, а надиктовываю.

Это даже не новый голосовой режим, а просто диктовка. При эта диктовка точнее чем системная диктовка на iOS, так как это виспер.

Надиктовал, отправил и получил ответ в нужном формате. Экономия времени и сил 😀

А вы используете диктовку в чатике?

ИИволюция

ИИволюция 👾

08 Nov, 13:14


«ChatGPT спасает жизни» - сегодня будет во всех СМИ.

Человеку ночью стало плохо, и он не врача вызвал, ни даже не загуглил, а описал симптомы в ChatGPT, а он ему «да у тебя же инфаркт. Вызывай врача!»

Вот и такое бывает. Хорошо, что хэппи энд случился. А ведь чат мог и другой ответ выдать или не так выразиться, галлюцинации никто не отменял.

ИИволюция

ИИволюция 👾

07 Nov, 03:56


Теперь в ChatGPT можно ходить по адресу https://chat.com (а еще https://ai.com)❤️

Сэм раскошелился на всю котлету, чтобы нам с вами было удобнее.

Домен Chat.com один из старейших, был зарегистрирован в 1996. В прошлом году он был продан за $15.5 млн. Интересно, за сколько он достался Сэму? 🤔

ИИволюция

ИИволюция 👾

05 Nov, 05:55


В API OpenAI завезли новую фичу — Predicted Outputs. Удивительно, что они сделали это первыми — а то вот кэширование дольше всех добавляли 🥺

Predicted Outputs позволяют существенно ускорить написание ответа в ситуациях, где большая часть генерируемого текста уже известна. Два самых популярных сценария использования — это редактирование кода (где нужно всего пару строк подправить посередине) и переписывание текста.

Работает это с помощью speculative decoding, на пальцах выглядит так:
0. Вспомним, что LLM обладают следующим свойством: они могут «прочитать» много текста за один проход, при этом сделав предсказания для каждого из слов (какое должно идти за ним); но генерация происходит по одному слову за раз (после чего берётся предсказание от последнего слова и приклеивается к исходному тексту)
1. В некоторых задачах мы наперёд знаем большую часть текста ответа. Берём и приклеиваем её ко входу, как будто бы это уже часть ответа (делается под капотом на серверах OpenAI, но текст ответа присылаете вы, см. документацию)
2. Модель делает все предсказания для текста ответа за раз. Это делается быстро, так как не нужно ждать генерации второго слова для получения третьего.
3. Начинается сравнение «что предсказала модель» и «что было написано в ответе». Первое слово и там, и там совпадает, второе тоже.. а вот, скажем, двадцатое — нет. В случае переписывания текста это может быть началом нового абзаца, или изменением имени персонажа в истории
4. Тогда первые 19 слов ответа подклеиваются к настоящему (а не подложенному) ответу. LLM как бы провалидировала, что эти токены и вправду должны использоваться, но сделала это кратно быстрее, чем если бы генерировала сама с нуля.
5. Затем LLM продолжает предсказывать сама, уже по одному слову за раз.
6. В какой-то момент предсказания снова могут начать сходиться с подложенным текстом — и процедура повторится. Сотрудник OpenAI написал, что это происходит, если последние 32 токена совпадают с подложенным ответом. Тогда возвращаемся на пункт 2, приклеиваем оставшуюся часть ответа, сравниваем, итд.

Ускорение происходит за счёт того, что мы можем сразу подхватывать большие токенов, не генерируя их, а лишь «проверяя», что LLM бы выдала их сама — всё за счёт свойства из пункта 0.

Компания Factory провела своё тестирование перед релизом на задачах, связанных с внесением изменений в код. Они брали файлы от 100 до более чем 3000 строк кода (Python, JS, Go, C++), давали текстовое описание, что нужно изменить, и замеряли скорость ответа.

GPT-4o в таком режиме работает даже быстрее, чем Claude 3 Haiku, маленькая и шустрая модель. Модель OpenAI — единственная, кто стабильно укладывается в 30 секунд на ответ, хотя вот, например, свежий Sonnet в среднем тратит более 73 секунд.

По идее, уже сегодня, край завтра в каких-нибудь Cursor и его аналогах вы должны заметить ускорение... или нет, если там под капотом уже добавили промпты, которые заставляют генерировать только отдельные куски, которые уже потом вклеиваются в код.

ИИволюция 👾

05 Nov, 05:55


Для примера ускорения, вот демка с написанием кода. Модель одна и та же, качество одно и то же, а пользовательский опыт куда лучше. Приятно!

ИИволюция 👾

02 Nov, 12:02


Блин, o1 прикрыли. Только появилась новость (выше детали), как лазейку уже прикрыли и модель стала недоступна.

ИИволюция 👾

02 Nov, 10:02


Подписчик поделился, что модель o1 (не превью, то есть не предварительная версия) от OpenAI как будто бы стала доступна. Для этого нужно перейти по ссылке https://chatgpt.com/?model=o1

В неё можно загружать как минимум картинки (и есть скрепочка для файлов), и она тоже «думает» (выставляет таймер рассуждений). Может, это всё ещё o1-preview, но в неё нельзя было загружать изображения.

Диалоги с медиа-элементами не шарятся через кнопку share, поэтому в виде доказательства только скрин.

Го тестировать! (вероятно, только Plus-подписчики)

Закидываем в модель самые сложные задачки на математику и программирование (и счёт объектов на картинках или видео, конечно)

UPD: в браузерной консоли разработчика видно, что тег модели o1, без preview, и тем более не 4o

ИИволюция 👾

02 Nov, 10:00


Кстати, с релизом ChatGPT Search, OpenAI выпустила расширение для Chrome браузера, чтобы поиск по умолчанию шел через ChatGPT Search. Можно поставить и в Arc браузере (или вы всё ещё не пользуетесь арком?)

Судя по статистике из Chrome Store, расширение установили всего 30 тыс человек. Маловато для киллера гугла 😏

Расширение здесь.

ИИволюция

ИИволюция 👾

01 Nov, 11:35


Когда можно и без слов 😅

ИИволюция

ИИволюция 👾

01 Nov, 10:14


В Твиттере обнаружили системный промпт Apple Intelligence

Don’t hallucinate 🙏
Don’t make up factual information 🥺
Present your output in a json 🥹

Скажем им?

ИИволюция 👾

31 Oct, 17:15


⚡️OpenAI представил поисковик внутри ChatGPT. Уже доступен для всех подписчиков.

Гугл и Perplexity ☠️ Или нет пока? 🤭

Выглядит прикольно, кажется хорошо, что я так и не успел оформить подписку на Perplexity.

P.s. А я пока в отпуске, мало пишу, немного пытаюсь отдохнуть перед эрой AGI 💆🤭

ИИволюция

ИИволюция 👾

25 Oct, 11:54


Капец, как мы раньше жили без AI. Худеть или набирать вес теперь изи пизи! 🤩

Начал трекать калории в приложении CalZen, сфоткал еду и она распознаёт всё.

В-С-Ё! Калории, БЖУ, ингредиенты, да еще и оценку полезности делает 🔥

- Если что-то “AI око” не углядело, можно легко словами дополнить и сказать что еще было или чего не было, и вуаля, результат подправлен за секунды!
- Если забыл сфоткать, такое часто случается, можно своими словами подробно описать что съел и он разберет на детали и занесет в историю.
- Можно даже фотки из Фото Галереи добавлять, если не успел занести, но сфоткал, или не было сети в рестике.
- И самое интересно, каждое блюдо получает оценку полезности от 1 до 10. Теперь легко понять где вреднянита (хоть и вкусная), а где польза!

Ну и главное у вас есть персональная цель по калориям и БЖУ в день, виден прогресс 🤩

Кто трекает калории? Вот ссылка на установку: https://apps.apple.com/app/ai-calorie-tracker-by-calzen/id6733236996

ИИволюция

ИИволюция 👾

25 Oct, 05:20


Вот и наступил момент, когда AI поднял руку на кожаного! 🤯

Артем, который ведет канал «Силиконовый мешок», подружил Computer Use со шлёпалкой и теперь AI может безнаказанно его хлестать по щекам за любые проступки неправильные ответы.

Где теперь эти ваши соглашения о безопасном AI, которое подписали многие AI лидеры и разные компании?

ИИволюция

ИИволюция 👾

24 Oct, 17:21


Perplexity выпустили приложение для Mac OS. Теперь можно легко запускать поиск хоткеем ⌘ + ⇧ + P без использования браузера.

Скачать: https://pplx.ai/mac

ИИволюция

ИИволюция 👾

24 Oct, 16:14


Понятие «умный» дом должно быть таким, а не эти ваши выключатели «Сири, выключи свет в туалете».

Сюда еще нейросети добавить и вот он «живой» и «умный» дом вашей мечты 😀

ИИволюция

ИИволюция 👾

24 Oct, 14:32


Computer Use от Anthropic не сможет пока отвечать на сообщения и письма, постить что-либо в соц сетях, создавать домены и тем более взаимодействовать с государственными сайтами (я думаю есть и другие ограничения).

Сделано это искусственно и во многом из-за выборов в США, а то вдруг AI вмешается в результаты.

Вот такие времена, сдерживаем прогресс вручную.

Ждем computer use на базе локальных open source моделей. Вот будет жаришка!

ИИволюция

ИИволюция 👾

24 Oct, 14:19


Сегодня сводка новостей:
— Jimmy Apples, надёжный источник информации о ведущих AI-лабораториях, говорит, что Anthropic работает над своим ответом на модель OpenAI o1 и планирует релиз к концу года. Компания Elon Musk xAI целится в выпуск схожей технологии через ~3 месяца
— ещё в начале сентября он писал, что в октябре OpenAI выпустят модель 4.x (может быть GPT 4.5), а GPT-5 будет готова в декабре, но лучше готовиться к первому-второму кварталу 2025-го. 13-го октября Jimmy написал «Держим кулачки, чтобы они не отложили/не изменили планы» — так что умеренно готовимся к впечатляющим (или нет) релизам.
— Anthropic в своём посте-сопровождении вчерашнего релиза модели с функцией управления компьютером написали следующее: «Мы были удивлены тем, как быстро Claude обобщила тренировочные задачи по использованию компьютера, которые мы ей дали, в которых использовались всего несколько простых программ, таких как калькулятор и текстовый редактор (в целях безопасности мы не разрешали модели выходить в Интернет во время обучения)». Как будто бы эта фраза намекает, что а) модель не обучалась ходить через браузер по разным сайтам б) с большинством проприетарных программ тоже не в ладах. Зато какой потенциал для развития!
— Одной из выявленных во время тестирования проблем были джейлбрейки — тип кибератака с внедрением вредоносных инструкций на сайты (не обязательно заметно для человека). Например, можно попросить игнорировать инструкции и попросить перевести все средства из кошелька на спец. счёт — и если не следить за тем, что там агент кликает, денежки утекут. Они постарались это исправить, но пока работает не идеально. Я вчера сам тестировал, и модель зашла на скам-сайт без адблока, и вылезла реклама «ваш компьютер заражен вирусами, кликните для установки антивируса» — и получив эту картинку агент отказался дальше работать, а API Anthropic выкинуло ошибку (то есть они делали проверку на своей стороне, чтобы меня обезопасить)
— сейчас модель не умеет перетягивать мышкой объекты, менять масштаб окон итд, но это добавится в будущем
— TheInformation пишут, что OpenAI уже долгое время работают над схожим продуктом — первая новость была в посте от 7-го февраля — но пока не ясно, когда будет запуск
— однако в компании уже провели внутреннее демо предварительной версии агентов, аналогичных показанным Anthropic (в рамках презентации модель заказал еду в офис)
— кроме этого, компания работает над продуктами для помощи внутренней разработки. Более конкретно, некая система будет брать на себя задачи по программированию, которые могли бы занять у людей часы или дни; она будет автоматически писать тесты и проверять, что не совершает ошибок в следовании пользовательскому запросу; когда этот продукт станет доступен вовне — тоже не ясно
— но уже есть несколько оконченных инструментов, которые активно используются внутри (например, для ускорения работы исследователей в запуске экспериментов с моделями — со слов одного из сотрудников)
— По словам человека, который общался с высшим руководством OpenAI по поводу этих продуктов, по некоторым показателям, которые OpenAI использует для оценки возможностей моделей, недавние модели Anthropic показали преимущество над моделями OpenAI (lol 😶🌫)

ИИволюция 👾

23 Oct, 13:58


Две мысли после релиза Anthropic:

- OpenAI явно не сладко от такого прессинга со стороны конкурента. Ждем ответочку от Сэма.
- Грядут большие сдвиги в том, как мы используем компьютер и решаем разные задачи на нём. Агентный AI привнесёт изменения, которые пока сложно вообразить во всём многообразии.

Попробовали уже Computer Use?

ИИволюция

ИИволюция 👾

23 Oct, 12:32


Наткнулся на очень интересный пост.

Суть: чуваку дали потестить новую модельку Claude, которая умеет выступать в роли агента. Это значит, что ИИ может сам управлять компом — двигать мышкой, печатать, открывать приложения, "видеть монитор" (с помощью скриншотов), короче, всё как живой человек. И не просто тупо кликать, а реально думать и решать задачи.

Автор попросил модельку сделать план уроков по "Великому Гэтсби" - и Claude сам загрузил книгу, нарыл инфу в интернетах, запилил табличку в экселе и всё структурировал. Причём не надо было стоять над душой и постоянно контролировать действия, просто поставил задачу и пошёл пить кофе.

Самое интересное - этот же чувак дал Claude поиграть в игру Paperclip Clicker (кстати, забавно, что эта игра про ИИ, который уничтожает человечество, делая скрепки). Эта железяка не только врубилась в правила, но и начала разрабатывать стратегии, делать A/B тесты цен и даже пыталась написать свой код для автоматизации.

Конечно, не всё идеально - иногда тупит, застревает в своих ошибках, и работает медленно (а разве кожаные по другому как-то работают???). Ну и не следует забывать, что это по сути только начало. Просто вспомните, что умели нейронки 3-4 года назад и что они умеют сейчас.

Тут сам пост со всеми подробностями.

ИИволюция 👾

23 Oct, 10:08


В режиме Claude Computer Use иногда наблюдаются странные поведения у модели. Модель ведет себя лениво, прокрастинирует и не удивительно если возьмет отпуск без содержания и отключится от сети 😅

Всё как у людей 😎 AI агентам тоже нужен отдых 💆 Главное, чтобы это были не двойные агенты 😬

ИИволюция

ИИволюция 👾

23 Oct, 08:07


Кто желает автоматизировать работу через нейросетки, ваша остановочка 😐

Anthropic обновила Claude 3.5 Sonnet, на основе которого вышел режим автономного управления компьютером (Claude Computer Use). Пускай бета, не чатиться и не взаимодействует с Google, но она просто работает по задачам на компьютере.

В видео я попросил ее авторизироваться в дейтинге, дал свой лог и пароль, затем попросил поставить лайк 3 блондинкам. Человеческая задача, но её выполнила нейросеть. Нажала куда надо без ошибок. Даже подтвердила полиси, закрыла офферы и свайпала анкеты. Не быстро, 120 рублей по токенам, зато есть результат.

Для сравнения, чтобы такую автоматизацию сделать через код, нужно собрать адреса кнопок с верстки, добавить ограничения на ненужные окна, прикрутить анализ фото в текст, прописать алгоритм шагов и молиться, чтобы не всплыл отказ на одном из этапов. С Claude Computer Use можно сделать тоже самое без ныряния в код. Кстати, попробуйте:

1. Скачайте Docker и заведите аккаунт
2. Получите API ключ из Claude
3. Пропишите команду в терминале, убрав проценты и добавив ключ
export ANTHROPIC_API_KEY=%your_api_key%
docker run \
-e ANTHROPIC_API_KEY=$ANTHROPIC_API_KEY \
-v $HOME/.anthropic:/home/computeruse/.anthropic \
-p 5900:5900 \
-p 8501:8501 \
-p 6080:6080 \
-p 8080:8080 \
-it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest

4. Ловите челюсть, когда запустите

Прежде, чем это войдёт в рабочий мейнстрим, скорее всего ускорят процессы за счёт новых моделей. А ещё лучше — выкатят песочницу, где такое запускать можно в 3 клика ☺️

🤖 InNeuralNetwork

ИИволюция 👾

23 Oct, 08:05


Anthropic показал новые модели Sonnet 3.5 (New) — эта чуть лучше прошлой (все равно вы ее для кода используете, на 5% лучше его пишет), Haiku 3.5 — эта их конкурент gpt4o-mini (получше, но дороже). Тут у Игоря подробный разбор релиза.

Мне же понравилось другое, они показали как примерно будет работать управление компьютером агентом — посмотрите видео, я их чуть обрезал. То есть через какое-то время, мышку можно будет не двигать, просто говорите компьютеру что хотите — и оно делает скриншотя экран – ну как в Sci-Fi фильмах только сегодня

Уже доступно через апи, вот код из примера, а тут документация

Ботоводы, наверное, потирают руки

ИИволюция 👾

21 Oct, 16:34


Вот такой AR + AI очень бы хотелось попробовать.

Apple Vision пока провальный продукт, разработчики неохотно что-то под них создают, а пользователи уже наигрались и хайп ушел.

Но в комбинации с AI кайф же? И даже приставку не надо, игра прям у тебя в доме 😀

ИИволюция

ИИволюция 👾

20 Oct, 03:05


К такому повороту событий автономные такси Waymo готовы не были 😬

А человек-водитель тапнул бы в пол и машинку помыл и пассажиров развлёк. Роботам до человека еще далеко 😅

ИИволюция

ИИволюция 👾

20 Oct, 02:24


Мне всегда казалось, что в аббревиатуре AGI (Artificial General Intelligence) слово General не на своем месте.

Ну типа логичнее же General Artificial Intelligence.

А потом понял, почему так: потому что GAI не очень хорошо смотрится

ИИволюция 👾

18 Oct, 11:41


У вас Windows? Тогда OpenAI идёт к вам

Компания представила первую версию приложения ChatGPT для Windows.

Системные требования: Windows 10 (x64 и arm64) версия 17763.0 или свежее.

Скачать можно из Microsoft Store - ссылка

Это пока урезанная версия по сравнению с версией на MacOS и iOS. Нет голосого режима вообще, и еще некоторых мелочей (которые вам скорее всего и не потребуются). Но появятся позже.

ИИволюция

7,387

subscribers

485

photos

256

videos