AI - агрегатор про нейронки | ИИ | AI @ainetworkss Channel on Telegram

AI - агрегатор про нейронки | ИИ | AI

@ainetworkss


Telegram канал об AI (artificial intelligence):

— новости из мира AI;
— тренды AI;
— внедрение AI;
— нейросети

Связь @Rom_rrr

AI - агрегатор про нейронки | ИИ | AI (Russian)

Добро пожаловать в Telegram канал AI - агрегатор про нейронки! Этот канал посвящен искусственному интеллекту (AI) и нейронным сетям. Здесь вы найдете самые свежие новости из мира AI, обсуждения актуальных трендов в сфере искусственного интеллекта, а также информацию о внедрении AI в различные области. Если вас интересуют нейросети и их применение, то этот канал станет для вас незаменимым источником информации. Присоединяйтесь к нам, чтобы быть в курсе всех событий в мире искусственного интеллекта. Связь с администратором канала @Rom_rrr.

AI - агрегатор про нейронки | ИИ | AI

13 Feb, 16:31


Прислали такую подборку. ИИ для переводов текста.

AI - агрегатор про нейронки | ИИ | AI

13 Feb, 16:27


Интеллектуальный каюк Homo sapiens близок.
Лишь 15 россиян способны программировать лучше ИИ, в Китае таких еще 59, а в США осталось лишь 7.

Потрясающее зрелище – наблюдать в реальном времени интеллектуальное поражение людей от ИИ.
Когда бестелесные алгоритмы превзошли лучших шахматных гроссмейстеров мира и ушли в отрыв, показывая немыслимый для людей рейтинг уровня игры, - репутация людей, как носителей высшего интеллекта, пошатнулась, но устояла – см. рис слева.
Ведь шахматы, как известно, - хоть и чрезвычайно умная игра, но узкоспециальная интеллектуальная деятельность, ограничиваемая фиксированными правилами.

Но с программированием (выполнением сложных задач кодирования и рассуждений) все иначе. Здесь все почти как в жизни. Вместо следования фиксированным правилам, нужно думать, рассуждать, строить гипотезы и прогнозы. И если с программированием произойдет, как с шахматами, то каюк интеллектуальному превосходству людей (только уникальная способность к инсайтам и останется, - и то, ненадолго).

Насколько этот каюк близок, показывают результаты CodeForces – международной платформы соревнований по программированию.
Текущие результаты модели о3 от OpenAI таковы.
• Рейтинг модели 2724 лучше, чем у 99.8% всех участников этой платформы (а там соревнуются десятки тысяч программистов со всего мира: 26 тыс китайцев, 14 тыс россиян, 3,5 тыс американцев) – см. рис справа вверху;
• Это значит, что во всем мире осталось меньше 200 человек, способных программировать лучше этой модели – см. рис справа внизу.

Остались считанные месяцы, когда людей, способных превзойти ИИ в программировании останется 50, 10, 3 … 0. А дальше модели, как и в шахматах, уйдут в отрыв, похерив интеллектуальное превосходство людей навсегда.

И никакой интеллект кентавра (гибридные системы из человека и ИИ) этому помешать не сможет. Урок с шахматами повторится. Ибо непреодолимым препятствием остаются ограниченные возможности когнитивной архитектуры людей.

Но это не беда. Ибо эволюции (генно-культурной) вообще до фонаря интеллект индивидов. Главное – рост коллективного интеллекта планетарной (а потом и вселенской) жизни. А уж кого в социо-когнитивных сетях глобального интеллекта окажется больше – людей или алгоритмов, - эволюции все равно.

Только ведь людям (и конкретно, нашим детям и внукам) это будет далеко не все равно …


Подробней см:
• https://arxiv.org/abs/2502.06807
• https://codeforces.com/ratings/countries

#ИИриски #Хриски #Вызовы21века

AI - агрегатор про нейронки | ИИ | AI

13 Feb, 16:17


Чего ждать от ИИ в следующем году: технологические тренды Gartner 2025

До конца года остаётся всего месяц, и это отличное время, чтобы обсудить основные тренды в области ИИ. Тем более, что аналитическая компания Gartner представила свои технологические прогнозы, сгруппировав их в три основные категории:

1. ИИ: Императивы и риски ИИ для защиты организаций

- Agentic AI: Автономные ИИ-агенты, способные сами планировать и действовать для достижения поставленных целей;

- AI Governance Platforms: Платформы для управления ИИ позволяют организациям управлять юридическими, этическими и операционными аспектами ИИ-систем;

- Disinformation Security: Технологии защиты от дезинформации снижают уровень мошенничества и защищают репутацию бренда через усиленные меры проверки.

2. Новые технологии побуждают организации пересматривать свои подходы к вычислениям

- Post-Quantum Cryptography (PQC): Постквантовая криптография защищает данные от угроз квантовых вычислений;

- Ambient Invisible Intelligence: Использование незаметных сенсоров для выявления ранее скрытых процессов в организациях, повышая эффективность и улучшая принятие решений;

- Energy-Efficient Computing: Энергоэффективные вычисления повышают устойчивость за счёт оптимизированной архитектуры и использования возобновляемой энергии;

- Hybrid Computing: Гибридные вычисления комбинируют различные механизмы для решения вычислительных задач, например, сочетание тензорных (TPU) и графических (GPU) вычислений.

3. Синергия человека и машины объединяет физические и цифровые миры

- Spatial Computing: Пространственные вычисления используют технологии расширенной (XR), дополненной (AR), смешанной (MR) и виртуальных реальностей (VR) для создания иммерсивных миров;

- Polyfunctional Robots: Многофункциональные роботы, выполняющие различные задачи и способные работать вместе с людьми;

- Neurological Enhancement:
Нейронные улучшения повышают когнитивные способности, считывая мозговую активность.

Углубимся в категорию императивов и рисков ИИ для защиты организаций.

Что касается ИИ-агентов, мне интересно наблюдать за компанией Artisan, которая разработала ИИ-сотрудника по имени Ava. Ava автоматизирует процессы отдела продаж — от поиска клиентов до закрытия сделок. Ava функционирует как полноценный член команды, не требуя постоянного контроля.

Такие инструменты, как AutoGen, LangChain и CrewAI, помогают создавать ИИ-агентов, которые могут самостоятельно выполнять задачи без постоянного вмешательства человека. Агентный ИИ обладает потенциалом кардинально преобразовать множество отраслей. Однако с ростом возможностей таких агентов возникает необходимость в строгом регулировании и этических стандартах.

Поэтому возникает потребность в инструментах, позволяющих контролировать и регулировать его применение. Платформы для управления ИИ становятся незаменимыми для компаний, стремящихся эффективно и безопасно интегрировать ИИ в свои процессы. Они предназначены для мониторинга работы ИИ-систем, регулярной проверки соответствия ИИ-решений установленным стандартам и нормам, а также для обнаружения возможных угроз, включая предвзятость алгоритмов и проблемы конфиденциальности данных. Один из примеров таких систем — Holistic AI.

В эпоху информационных войн и фейковых новостей технологии борьбы с дезинформацией становятся жизненно необходимыми. Например, Sensity AI помогает обнаруживать дипфейки в реальном времени. По прогнозам Gartner, к 2028 году 50% предприятий будут использовать продукты и услуги, направленные на борьбу с дезинформацией, что значительно выше текущих показателей.

В ближайшие годы прогнозируется стремительный рост инвестиций в эти направления, и только те организации, которые оперативно адаптируются к быстро меняющемуся технологическому ландшафту, смогут сохранить свои лидирующие позиции и оставаться конкурентоспособными на рынке.

#технологии

AI - агрегатор про нейронки | ИИ | AI

13 Feb, 11:10


Для тех, кто еще не видел, интересный график количества вакансий в ИТ / разработке. Первый провал на графике — ковид. Второй — ИИ. Пока что отменяют манкикодеров, но экспертиза в цене. Сегодня любой нубас с GPT может заделиверить MVP. Завтра все это будет работать и без нубаса. Послезавтра — аналогичный тренд ждёт все остальные офисные профессии. Для один повод поужасаться, для других — уникальная возможность, когда меняется структура рынка.

AI - агрегатор про нейронки | ИИ | AI

13 Feb, 11:10


Качество LLM в программировании не просто растет, а растет экспоненционально. На этом графике показан ELO рейтинг моделей в Codeforces. Звучит дико, но до конца года мы можем увидеть ИИ, который входит в десятку по миру.

Что не исключает задачу формирования требований, идей, желания и идей для продукта. Не исключает сложность координации сложных систем и большого количества людей. Не исключает принятия сложных решений и абстрактного архитектурного мышления.

AI - агрегатор про нейронки | ИИ | AI

13 Feb, 10:12


📊 Anthropic представила экономический индекс: как AI меняет рынок труда

Anthropic запустила Anthropic Economic Index — инструмент, отслеживающий влияние AI на экономику. В отличие от прогнозов, индекс анализирует реальные данные: более миллиона анонимизированных диалогов с Claude, показывая, какие задачи уже делегируют AI.

Ключевые выводы:
— AI чаще используется для кодинга (37.2% запросов), редактирования текстов (10.3%) и анализа данных.
— Автоматизация vs. Аугментация: 43% задач полностью выполняются AI, но в 57% случаев AI помогает человеку, дополняя его работу.
— Кто использует AI? Чаще всего специалисты с средним и высоким доходом — программисты, аналитики, редакторы. Работники с низкими и сверхвысокими зарплатами используют AI реже.
— Открытые данные: Anthropic выложила датасет в открытый доступ, пригласив экономистов и исследователей к сотрудничеству.

Данные индекса могут стать основой для новых AI-продуктов и помогут понять, какие профессии AI меняет прямо сейчас.

🔗 Economic Index: https://www.anthropic.com/economic-index
📝 Paper: https://www.anthropic.com/news/the-anthropic-economic-index

AI - агрегатор про нейронки | ИИ | AI

07 Feb, 12:25


Видеореставрация. Проект Starlight: первая в истории диффузионная модель для восстановления видео

Очень интересно: Топаз поднял веки и разродился своей моделью.

Недавно обсуждали апскейлеры картинок и разницу между апскейлерами (добавление деталей, заточенность под контент, недобавление деталей и пр.).

В области апскейла видео, а не фото, Топаз, конечно, пока чемпион.

И они только что бахнули новую модель Starlight для реставрации видео.

Давайте порассуждаем в коментах про разницу между апскейлом и реставрацией, а вы пока посмотрите примеры.

Приповзресерчил насчет деталей:
Вы можете бесплатно восстановить 10-секундные видосы (лимит не знаю), а если вонзите денег за кредиты, то можно в 5-минутные видео с титрами(?!) в 1080p. Корпоративная версия будет поддерживать более длинные видео и вывод в более высоком разрешении.

"Наша первая в истории диффузионная модель для восстановления видео занимает много времени и требует больших затрат".

Не знаю насчет первой в мире, но звучит интересно и в меру хвастливо:

"Созданный на основе совершенно новой архитектуры моделей, наш подход, основанный на диффузии, использует 6B+ параметров. Это самый динамичный и широкомасштабный метод улучшения видео. Видео ухудшается из-за артефактов сжатия, размытия, алиасинга, шума, атмосферных искажений, недостающих пикселей и т. д.
Каждый кадр страдает от уникальных типов повреждений, что делает восстановление видео с помощью искусственного интеллекта очень сложной задачей.
Наша технология решает эту проблему, анализируя сотни кадров для точного восстановления деталей, обеспечивая непревзойденное восстановление деталей в сочетании с беспрецедентной временной согласованностью."

Полностью автоматическая реставрация: модель автоматически денойзит, деблюрит, повышает резолюшн и анти-алиасит (язык и глаза сломались, да). Никаких ручных настроек, никакой настройки параметров (очень круто, как по мне).

Пока нет ничего, кроме Coming soon и закрытой беты для тестирования.

И тут повод развязать дискуссию в коментах о том, что диффузия добавляет детали, которые порой неуместны (ненужные эмоции, например) и что это уже креативная реставрация в духе магнифика, а не старый добрый наукоемкий топаз. Но надо смотреть в деле, а пока ждем и дискутируем.

@cgevent

AI - агрегатор про нейронки | ИИ | AI

05 Feb, 18:28


Имба для удалёнщиков — Pickle

Записываем 3 минуты своей говорящей головы. Затем ждём сутки, а то и двое, пока тренируется моделька — и вуаля, готово! Лежим на диване во время мита, пока ваш виртуальный клон с реалтайм липсинком отсиживается за вас перед веб-камерой.

Это молодой стартап с командой из 5–7 человек, так что технических деталей никаких. Есть только подписка, по которой за 24 бакса в месяц можно наговорить аж на 1000 минут (чего, надеюсь, хватит всем). Пока работает только на Mac — поддержка остальных устройств в разработке.

Пообещайте, что не будете пользоваться этой штукой 😗

getpickle.ai

@ai_newz

AI - агрегатор про нейронки | ИИ | AI

05 Feb, 15:50


Иисус и мемы.

То, что на мой взгляд не получилось у Pika — спозиционировать себя как генератор приколов для социальных сетей — получается у сервиса PixVerse. Никаких скучных раздувателей/комкателей объектов — обнимайтесь с Иисусом, родственниками, тиграми. Становитесь Халком, Веномом, Сэйлор Мун. И ещё десятки вариантов. В день можно генерить несколько видосов.

Получается проклято, но что ещё нужно для хорошего мема. 😎

AI - агрегатор про нейронки | ИИ | AI

02 Feb, 11:15


📓Вышел огромный список мастридов про ИИ на 2025 год — всех материалов хватит на каждую неделю грядущего года.

Команда Latent Space, рассылки для инженеров по искусственному интеллекту, одноименный подкаст о технология и крутое сообщество визионеров, куда входит, например, Андрей Карпатый, экс-директор по ИИ в Tesla и сооснователь OpenAI, выбрали 50 статей и блогов по 10 важнейшим направлениям в области ИИ-разработки: от файн-тюнинга и промт-инженеринга до ИИ-генерации голоса, речи и зрения.

Авторы уверены, что список не только исчерпывающий, но и идеально подходит для новичков, которые только хотят разобраться в AI и ML.

Вот 10 уроков, разбитых на тематические секции:

1️⃣ Глава: Frontier LLMs

2️⃣ Глава: Benchmarks and Evals

3️⃣ Глава: Prompting, ICL & Chain of Thought

4️⃣ Глава: Retrieval Augmented Generation

5️⃣Глава: Agents

6️⃣ Глава: Code Generation

7️⃣ Глава: Vision

8️⃣ Глава: Voice

9️⃣ Глава: Image/Video Diffusion

🔟 Глава: Finetuning

AI - агрегатор про нейронки | ИИ | AI

02 Feb, 07:13


Krea + Deepseek = Krea Chat

Krea, конечно, отжигает...

@cgevent

AI - агрегатор про нейронки | ИИ | AI

02 Feb, 07:13


У ChatGPT 15,5 миллионов платных подписчиков

По данным The Information, с сентября добавилось более 4 миллионов подписчиков. Их доля общем количестве юзеров не растёт и составляет около 5%, а рост в количестве подписчиков обусловлен ростом юзербазы, которая за 2024 год утроилась.

А вот средняя выручка с подписчика растёт - Pro подписка уже приносит больше выручки чем Enterprise, то есть количество Pro подписчиков уже измеряется в сотнях тысяч. При этом всём, по заявлениям Сэма Альтмана, подписка месяц назад была убыточной - OpenAI не расчитывали на такое активное использование. При таких вводных подписка в $2,000 звучит уже не так безумно как несколько месяцев назад.

Ещё быстрее подписок росла выручка с API - за 2024 она выросла в 7 раз, при том что компания несколько раз за 2024 год сбрасывала цены. Вот вам и наглядная иллюстрация парадокса Джевонса.

При этом всём, сколько именно зарабатывают сейчас OpenAI понять трудно. Хоть мы и знаем, что за первое полугодие 2024 проекция выручки удвоилась до $3,4 миллиарда долларов в год, но как повлияли на выручку запуск Voice API и o1 - незвестно. Зато известно что переговоры про новый раунд инвестиций размером в $40 миллиардов, ведутся уже при оценке компании в $260 миллиардов, что на 73% выше оценки в октябре 2024

@ai_newz

AI - агрегатор про нейронки | ИИ | AI

31 Jan, 19:30


The Dor Brothers делают крутые видосы с помощью ИИ.

AI - агрегатор про нейронки | ИИ | AI

31 Jan, 09:02


«Хотите углубить свои знания? Обратите внимание на эту подборку каналов! 👍

Здесь вы найдете полезные советы, необычные новости, промпты, изображения и прямые эфиры с интересными личностями! 🤯 Это отличная возможность для тех, кто стремится развиваться в сфере ИТ.

Не пропустите шанс подписаться и быть в курсе самых актуальных событий. Давайте расти вместе! 😉

Переходите по ссылке и присоединяйтесь!»

AI - агрегатор про нейронки | ИИ | AI

13 Jan, 18:30


76-летний парализованный мужчина написал китайские иероглифы силой мысли с помощью нейроимпланта BrainTalker

Учёные из Чжэцзянского университета в Китае сделали важнейший шаг в области нейротехнологий. Это первый случай в мире, когда интерфейс мозг-компьютер, известный как BrainTalker, успешно использован для написания китайских иероглифов – одной из самых сложных систем письменности.

Вот что стоит знать об этом эксперименте:

- Пациенту 76 лет, и он полностью парализован. Это означает, что его способность к движению сведена к нулю. Тем не менее, благодаря BrainTalker, он смог "управлять" роботизированной рукой.

Как работает BrainTalker:
устройство считывает нейронные сигналы из мозга пациента, которые затем преобразуются в команды для роботизированной руки. Это позволяет выполнять сложные движения, такие как написание иероглифов.

Сложность задачи:
китайские иероглифы требуют высокой точности и координации движений, что делает этот результат особенно впечатляющим.

Для настройки системы потребовались многочисленные тесты, чтобы "обучить" интерфейс правильно интерпретировать нейронные сигналы пациента.

Почему это важно?


1. BrainTalker даёт надежду людям с ограниченными возможностями на восстановление базовых функций, таких как письменная и устная коммуникация.

2. Эта технология может быть использована для управления различными устройствами – от компьютеров до экзоскелетов, расширяя границы возможностей человека.

3. Первая успешная работа с китайской письменностью демонстрирует потенциал применения технологии в разных языках и культурах.

Но, как всегда, остаются вопросы: как защитить эти устройства от злоупотреблений, и готовы ли мы к интеграции таких технологий в повседневную жизнь?

Что думаете об этом прорыве? Это революция в науке или слишком рискованный эксперимент?

AI - агрегатор про нейронки | ИИ | AI

03 Jan, 10:01


Прозалипал целый цень в ШТОРМ от Стенфонда с новой фичей — conversation mode.

Эта штука делает тонну онлайн рисерча (по 30-60 минут гуглежа за раз навскидку) и пишет исследовательские статьи. А теперь еще в ней появилась фича чата между экспертами, которые помогают раскрыть сложные темы с точки зрения разных дисциплин.

Поиграться бесплатно: https://storm.genie.stanford.edu/

Вот, например, статья о влиянии ИИ на рынок труда или обсуждение влияния снижения ставок ФРС.

Написано лучше, чем 90% «экспертов» по теме, с цифрами и цитированиями работ.

AI - агрегатор про нейронки | ИИ | AI

03 Jan, 08:41


🔥 Привет! Хотите попробовать что-то реально крутое?

Я запустил новый сервис — VisionCraft, где собрано больше 10 000 лучших моделей ИИ для генерации изображений, текстов и даже GIF'ов. Такие модели, как Flux, SDXL, SD3 и многие другие, уже ждут вас!

Проект совсем новый, и я был бы безумно рад, если вы поддержите меня:

1️⃣ Попробуйте сервис: visioncraft.top
2️⃣ Если вам понравится, поделитесь ссылкой с друзьями или знакомыми.

Ваши отзывы и поддержка для меня очень важны 🙌. Давайте создавать что-то классное вместе!

AI - агрегатор про нейронки | ИИ | AI

01 Jan, 16:16


А вот и данные по влиянию ИИ на рынок труда - уже не гипотезы. Вакансий на «входной уровень» в профессию (джуны) -30%. Под риском - весь младший персонал, опытные менее затронуты.

по данным Bloomberg:

- для графического дизайнера начального уровня риск автоматизации задач составляет 50%, а для арт-директора — всего 24%
- у торгового представителя риск автоматизации — 67%, а у менеджера по продажам — только 21%
- у начинающего маркетолога — 53%, у опытного — 9%

Вывод очевиден- гильдийная метода обучения подмастерий (помогай и присматривайся) больше не нужна. Зато рулить будет отбор по характеристикам, обучение в игровых тренажерах и средах (зачет игровых/волонтерских портфолио).

Люблю приводить пример - пилотов авиации не готовят понабрав джунов и дав им угробить 99 самолетов из 100. Отбор, тренажеры, второй пилот, первый. И прекрасно работает.

AI - агрегатор про нейронки | ИИ | AI

01 Jan, 13:26


В твиттере вирусится видео, где Нетфликc как бы использует ИИ для дубляжа и одновременного липсинка.

Я вам предлагаю почитать хороший материал про то, как вообще нетфликс использует ИИ.

И там есть вот такой текст:

После успеха таких интерактивных сериалов, как "Бандерснэтч", Netflix, возможно, начнет изучать интерактивные истории с использованием ИИ, позволяя зрителям самим выбирать сюжет, который может включать дубляж с ИИ в зависимости от языковых предпочтений зрителя.

Использование искусственного интеллекта Netflix может стать мощным инструментом для предсказания потенциального успеха контента еще до его выхода - идея, которая не так уж далека от реальности, если учесть, что гигант потокового вещания уже использует аналитику.

Deepdub - это сервис, который использует Нетфликс для дубляжа.
https://deepdub.ai/post/how-netflix-leverages-ai-unveiling-the-tech-behind-the-stream

@cgevent

AI - агрегатор про нейронки | ИИ | AI

01 Jan, 13:24


Runway Middle Frames

Выглядят довольно продуктово.

Дальше никто не мешает сделать интерфейс с таймлайном и маркерами и несколькими/многими ключевыми кадрами. И получить хорошее решение "раскадровка2видео".

У Сора есть что-то подобное в новом интерфейсе с таймлайном. Я потестил рождественскую Сору с американским ВПН. Но там практически невозможно получить такие примеры с людьми. Она орет как резаная, даже когда ей даёшь её же генерации. "Тут кожаные, срам какой!".

Соре точно надо к терапевту, подавленная телесность до добра не доведет, а мы получим закомплексованные картинки в голову.

Рунвей молодцы, людишек не бояцца, а ключевые кадры постепенно переползут в решения для консистентных раскадровок и монтажа.

@cgevent

AI - агрегатор про нейронки | ИИ | AI

31 Dec, 13:13


Genesis: опенсорсная платформа + модель, которая может симулировать физику реального мира в 3d.

Умеет делать:
- Физически точные и пространственно согласованные видео
- Движения камеры и её параметры
- Движения человеческих и животных персонажей
- Локомоция роботов, применимая в реальном мире
- Полностью интерактивные 3D-сцены
- Генерация открытого мира с артикулированными объектами
- Речь, анимация лица и эмоции

AI - агрегатор про нейронки | ИИ | AI

31 Dec, 11:26


Новая text-to-video модель от Гугла для тех кто сомневался, что ИИ сможет генерировать нетфликс и ютуб контент в реальном времени. Пока не в реальном, но это решаемо.

Доступно для вашего креатива уже сегодня (но, если вы в EU то через годик минимум, а если в РФ то никогда).

AI - агрегатор про нейронки | ИИ | AI

24 Dec, 16:30


Генератор эмоджи (AI) - 105.550$ за ноябрь 2024

Похоже тем, кто хотел заработать нельзя было пропускать хайп-трейн AI.

Хотя лично я отношусь очень спокойно к искусственному интеллекту, проекты, которые состоят из пары тысяч строк кода и приносят 100.000$ в месяц не могут оставить равнодушным 😐

emojis.sh - можно описать эмоджи, который хотите получить и AI cгенерирует по уже готовым промтам его для вас.
Ну или пошариться по огромной библиотеки уже готовых и выбрать что-то симпатичное.

Выше скрин от автора (проверить правда это или нет в этот раз не представляется возможным).

Но поверить в такие цифры легко могу.

AI - агрегатор про нейронки | ИИ | AI

23 Dec, 08:02


Один бот - множество AI инструментов

В боте нет никакой рекламы и не нужна регистрация

🎙 Расшифровывай аудио
🌐 Анализируй сайты, ищи информацию в интернете
🎨 Генерируй картинки для своих проектов

А также другие функции для работы с Текстом, Документами, Аудио, Изображениями и Видео

Ваш путь к передовым технологиям ИИ и инновациям 👉 @TraAI (бесплатный месяц)

AI - агрегатор про нейронки | ИИ | AI

16 Dec, 21:51


Ну, за подкасты.
Не очень понятно зачем теперь нужны кожаные блогеры, влогеры, инфлюматьихенсеры.

Я тут смотрел, как народ упарывается в NotebokLM, создавая аудио-подкаст из текста, потом вырезает в аудасити звук для каждого голоса, потом огородит с хейгеном и звуком, и тд.

Все.

Одна кнопка.
Сделать красиво.
Тупо, но красиво.
А зачем еще это все?

Хейген, похоже, сами не понимают, как они троллят интернет.

@cgevent

AI - агрегатор про нейронки | ИИ | AI

26 Nov, 18:02


🦸‍♀️Стартап, который нам надо! Только не рассказывайте о нем своей команде

Я не ИИ-обзорщик, но видео нового решения в области виртуальных аватаров наглядено демонстрирует: вы можете притвориться, что находитесь на видеозвонке в Zoom в офисе, даже если потягиваете «Маргариту» в гамаке где-то далеко. Команда Pickle показала ИИ-аватаров, которые синхронизируются с вашим голосом и вместо вас участвуют в видеозвонках с коллегами, пока вы сидите в кафе или едете за рулем. С последним, правда, есть нюанс: шум повортника он пока не подавляет.

🟡Как это устроено?

Загружаем в Pickle 5-минутное видео, и через двое суток ИИ генерит ваш аватар, который буквально скопирует вашу мимику — в той же одежде и на том же фоне. Дальше во время созвонов виртуальный аватар синхронизируется с голосом и в режиме real-time воспроизводит вашу мимику. То есть вы можете созваниваться с коллегами хоть с пляжа, но никто об этом не узнает.

🟡Где работает?

Pickle уже доступен на MacOS, а версию для Windows обещают в декабре этого года. Самое приятное: сервис поддерживает платформы Zoom, Google Meet и Microsoft Teams. TechCrunch обращает внимание, что из-за высокого спроса процесс создания аватара может занять больше времени.

🟡Сколько стоит?

Подписка не очень дешевая: есть базовая, стандартная и профессиональная — стоимостью $288, $576 и $1152 в год соответственно (примерно от 29 тысяч до 117 тысяч рублей по курсу ЦБ на 25 ноября 2024 года). Как я поняла, от плана зависит количество часов для звонков в реальном времени и доступ сразу к нескольким аватарам вместо одного. То есть вы можете записать себя в раных версиях: прическа, мейкап и одежда.

AI - агрегатор про нейронки | ИИ | AI

24 Nov, 19:32


Если и делать нейрорекламу Кока Колы, то только такую.

Согласитесь, смотрится куда круче нейрорекламы от самой Coca Cola.

AI - агрегатор про нейронки | ИИ | AI

14 Nov, 13:21


📃500 реальных кейсов использования AI в крупных компаниях

Увидал у ребят из Evidently AI любопытную базу из 500 реальных применений ML и LLM систем. Там есть краткое описание, теги для поиска и ссылки на подробные объяснения. В базе просто любопытно позалипать и почитать, но может вам для дела еще пригодится.

Ссылка: https://www.evidentlyai.com/ml-system-design

P.S. Отмотал таблицу до конца и проверил — там реально 500 записей🤓

@TheEdinorogBlog — тот самый канал про стартапы🦄

AI - агрегатор про нейронки | ИИ | AI

14 Nov, 07:33


Бывшие сотрудники соцсети X запустили «умный» агрегатор новостей Particle

Приложение может кратко объяснить суть новости, а также рассказать о ней с разных точек зрения

С помощью ИИ Particle создает для пользователей краткие и понятные сводки событий. В приложении есть несколько режимов подачи информации: например, объяснение «как для пятилетнего» или лаконичные сводки в формате 5W (что, кто, где, когда, почему).

Функция «Противоположные стороны» позволяет изучить мнения обеих сторон конфликта, а «Политический спектр» показывает, насколько активно новость освещали издания с правыми и левыми взглядами. В приложении также есть чат-бот, который может ответить на вопросы, связанные с инфоповодами.

ℹ️ Particle основали в 2023 году бывший директор по управлению продуктами X Сара Бейкпур и инженер X и Tesla Марсель Молина. Приложение уже привлекло $15,3 млн инвестиций.

@settersmedia_news

AI - агрегатор про нейронки | ИИ | AI

13 Nov, 14:04


Демо-видео, показывающие фантастические возможности модели PaLM-E в выполнении комплексных задач.

Примеры включают получение конкретных предметов, сортировку блоков по цвету, выполнение задач с толканием объектов, а также демонстрацию способности модели обобщать действия на новые объекты, с которыми робот ранее не сталкивался.

#технологии

AI - агрегатор про нейронки | ИИ | AI

13 Nov, 13:55


Большие поведенческие модели (LBM): новый этап в развитии ИИ

Представьте робота, который изучает, как вы готовите еду, и с каждым приготовленным вами блюдом он сам становится всё более искусным поваром. Разбираемся, как большие поведенческие модели (LBM) помогут роботу в этом деле.

Несмотря на впечатляющие достижения больших языковых моделей (LLM) в обработке и генерации текста, они не умеют обрабатывать изображения или сенсорные данные, необходимые роботу для ориентации в физическом пространстве, “понимания” объектов и обучения действиям пользователя.

Так Visual Language Models (VLM), обрабатывающие визуальные данные, могут “понимать” содержимое изображений и отвечать на вопросы по изображениям. Примером такой модели является GPT-4-Vision.

Large Action Models (LAM) обучены на данных о действиях (в том числе из сенсоров). LAM превращают LLM в автономных агентов, способных выполнять комплексные задачи, ориентированные на вызов определённых функций, улучшенное понимание и планирование. Salesforce уже начали выпускать такие модели для автоматизации процессов.

Visual Language Action Models (VLA) обучены на визуальных данных и данных о действиях. Они дают LLM возможность быть “воплощённым” агентом (Embodied Agent) в физическом мире. Например, RT-2 демонстрирует способность робота выполнять сложные команды благодаря использованию цепочки рассуждений. PaLM-E — мультимодальная языковая модель с 562 миллиардами параметров, демонстрирующая высокую универсальность и эффективность. А OpenVLA — открытая модель с 7 миллиардами параметров поддерживает управление несколькими роботами одновременно.

Для обучения агентов применяется обучение с подкреплением (Reinforcement Learning, RL). Существуют различные RL-методы, но в целом обучение агента построено на политике вознаграждений и наказаний за совершение определённых действий. Среди RL-методов также есть обучение с подкреплением на основе обратной связи от пользователя (Reinforcement Learning from Human Feedback, RLHF).

Комплексно задачу по обучению роботов действиям человека решают LBM (Large Behavior Models) — большие мультимодальные поведенческие модели, представляющие новое направление в ИИ. LBM направлены на понимание, моделирование, адаптивное обучение и генерацию человеческого поведения в физическом мире (похоже на RLHF на основе данных из физического мира).

Большие поведенческие модели уже используются на практике:

1. В Lirio разработали первую в мире LBM для здравоохранения. Их модель создаёт гиперперсонализированные рекомендации для пациентов на основе медицинских данных и данных о поведении пациента от различных датчиков.

2. Toyota Research Institute совершил прорыв в обучении роботов новым сложным навыкам с помощью метода Diffusion Policy. Их роботы могут быстро осваивать новые действия, такие как наливание жидкостей или использование инструментов, без необходимости перепрограммирования.

3. Стартап Physical Intelligence привлёк $400 миллионов инвестиций от Джеффа Безоса, OpenAI и других крупных игроков. Они стремятся создать роботов, которые смогут выполнять любые задачи по запросу пользователя, будь то уборка, сборка мебели или обслуживание клиентов.

Однако, как отмечал философ Людвиг Витгенштейн в своём "Логико-философском трактате": "Границы моего языка означают границы моего мира". Это актуально для LBM, так как они всё ещё ограничены данными, на которых обучены. Их "мир" определяется теми модальностями, что они могут воспринимать через сенсоры и понимать с помощью алгоритмов.

Для обучения качественной поведенческой модели нужно больше датчиков для сбора данных из различных модальностей. Так данные электроэнцефалографа позволили бы лучше распознавать и имитировать человеческие эмоции. А обучение моделей с помощью синтетических данных из симуляций делает "картину мира" LBM более разнообразной.

В реальном мире мы пока можем отличить робота от человека. Но возникает вопрос: а как мы будем отличать человеческое поведение от ИИ в цифровом мире?

#технологии

AI - агрегатор про нейронки | ИИ | AI

13 Nov, 13:54


«Мэтчим не тела, а души» с дейтинг-сервисом на базе ИИ

В 2019 году я запустил свой первый стартап и первое в России корпоративное дейтинг-приложение.

В то время я работал руководителем команды из 10 дата-инженеров и дата-сайентистов в Сбере. Все участники команды были одинокими парнями от 22 до 26 лет.

За обедом коллеги часто делились историями о своих свиданиях в тиндере. Один из них потратил около 30 тыс. рублей в месяц за несколько свиданий, которые не привели к долгосрочным отношениям.

Как специалисты по данным, мы не могли не подумать о том, что это происходит в том числе потому, что дейтингу как коммерческому продукту совершенно невыгодно устраивать эффективные метчи, приводящие к удалению приложения. Наоборот, его задача — максимально растить возвращаемость и конверсии в платные подписки.

Поскольку в тот момент команда работала над задачами Стратегического блока, связанными с оптимизацией процессов компании, у нас был большой массив данных о сотрудниках. В обезличенном виде, конечно: психотип, образование, на что они тратят деньги, какие рабочие задачи выполняют, о чем пишут рабочие письма, когда приходят и уходят из офиса, и много чего еще.

Я решил использовать эти данные для того, чтобы создать некоммерческий внутренний дейтинг и мэтчить, образно выражаясь, не тела, а души — не для извлечения прибыли, а для того, чтобы пользователь в итоге удалил приложение, найдя свою пару. С этой идеей я пошел в бизнес-акселератор от Сбера. В акселераторе я три месяца занимался исследованием проблемы, рынка и созданием MVP (минимального продукта) под кураторством опытного ментора. В процессе работы я узнал много интересного: например, что в России более 40% одиноких людей, в Японии и Великобритании существуют министры по одиночеству, а так же что треть офисных романов заканчиваются созданием семьи.

В итоге я разработал ансамбль из рекомендательных алгоритмов на базе имеющихся данных о сотрудниках, который помогал максимизировать вероятность нахождения лучшей пары среди коллег. Мне помогли сделать мобильное приложение и мы запустили бета-тест дейтинг-сервиса. Пользователи получали 10 лайков в день, чтобы процесс смахивания был более осознанным, а не превращался в бесконечный скроллинг. Кроме того, прежде чем принять решение о лайке, пользователю необходимо было пролистать всю анкету потенциального партнера.

В результате один из участников нашей команды нашел свою пару в первый же день бета-теста, их отношения продлились несколько лет. Остальные участники команды также нашли свои пары. Мы победили в бизнес-акселераторе Сбера и решили масштабировать сервис на всю Россию (к чему я был не совсем готов).

Официальный релиз SberDating для сотрудников состоялся 14 февраля 2020-го года. В день запуска к нам пришло более 6000 пользователей, и со временем их количество начало расти. Сервис существовал до 2021 года, пока я работал в Сбере и поддерживал его на добровольных началах. На протяжении пяти лет после запуска бета-теста мне не переставали писать люди, которые выражали благодарность за то, что с помощью нашего сервиса нашли свои пары, а некоторые даже вступили в брак.

При масштабировании на Россию я встретил две проблемы:
— отсутствие обогащенных данных по пользователям, которые не работают в Сбере;
— не получилось создать сходимую финансовую модель в условиях, когда пользователи быстро находят себе пару и удаляют приложение.

Превращать эту историю в еще один обычный дейтинг не хотелось, но мне понравилось делать стартапы, приносящие пользу. В Сбере это делать было сложно, а для самостоятельного плавания на тот момент мне не хватало навыков в области создания устойчивых бизнес-моделей и маркетинга. Поэтому я ушел из Сбера набираться опыта в ИИ-стартапах в роли технического директора венчурной студии.

Сейчас я чувствую себя готовым выводить на международный рынок классные ИИ-продукты, которые будут полезны многим людям.

#кейсы

AI - агрегатор про нейронки | ИИ | AI

05 Nov, 13:05


Красная панда - очень хороша на первый взгляд.

Причем она умеет в два мегапикселя и генерит очень быстро. Псина в очках и ZZ-Top - это 2048на1024. И там шерсть и бороды в отличном качество (тг жмет качество).

Промпта слушается отлично. Девушек на траву укладывает исправно.

Пока очень нравится.

@cgevent

AI - агрегатор про нейронки | ИИ | AI

05 Nov, 06:04


А теперь за Клабхаус.

Берем NotebokLM, в который кстати приподсунули новые фичи:
Теперь вы можете настраивать подкасты с помощью кастомных инструкций. Вы можете экспериментировать с тоном, целевой аудиторией, конкретными темами, источниками и т. д.

Для тех кто в танке это пока еще существующий сервис от Гугла, который берет на вход любой текстовых документ (статья, страница в вебе, пдф, эссе) и превращает его в подкаст, где два ИИ-подкастера очень ловко трут голосом за тему, изложенную в документе. Этакая аудиокнига на двоих или радиоспектакль(слово то какое).

Так вот берем NotebokLM и кормим ему хайповые темы. Генерятся подкасты тоннами.
Потом с полки берется запылившийся Клабхаус (для тех кто в танке, погуглите), и туда, в его комнатки наливается все это добро. Туда также пристегиваютcя полчища ботов, которые задают вопросы по темам.
Ну и можно навалить сверху аватаров из предыдущего поста.

Получаем бесконечно телевидение. ИИ-Клабхаус на стероидах.

А кожаные сидят и внимают. Как было с Клабхаусом. Сбежались все, я помню, как бандерлоги к Каа.

А продавцы трафика уже считают прибыли.

Кстати, ютюб уже потихоньку забивается этим говном, сгенеренным с помощью NotebookLM. И как обычно, жемчужины тонут в мире шлака, ибо метрики у нас - количество, а не качество.

@cgevent

AI - агрегатор про нейронки | ИИ | AI

04 Nov, 16:22


Агенты ИИ. Вот здесь, их очень много. И хрен знает как с этим быть :) - даже начинать думать, как это дальше изучать уже утомительно. Всего 403 на каждый вкус и цвет.

p.s. не удивлюсь, если chatGPT будет под "капотом" у каждого:)

Русский ИТ бизнес

AI - агрегатор про нейронки | ИИ | AI

31 Oct, 21:20


Clubhouse, который мы заслужили.

Помните такой проект. Красивый был, но умер. Но ничего, скоро возродится. Навалю диванных мыслей про это.

Смотрите, есть две новости.

Несвежая: Zoom объявил о том, что в скором времени они позволят вам создавать ИИ-аватар, который вы сможете использовать для отправки коротких сообщений своей команде. Ну то есть только для сообщений.


Свежая: HeyGen вчера бахнул подключение (своих) ИИ-аватаров к встречам в Zoom. Поглядите ролик в шапке. Да, пока нельзя своих, только хейгеновских.

Но промотаем чуть вперед. И вот уже на встречах сидят ваши аватары и долго трут за жизнь и бизнес. Возможно бесконечно. Ведь метрики в корпоративном сегменте - время упорной работы, часы на совещаниях, объем переписки и документов. У каждого за спиной своя ЛЛМ-ка, подученная и зарагованная на ваших переписках, переговорах, доках. И вот они изрыгают цепочки мыслей, брейнстормят, а аватары все это эмоционально излагают.

А за Клабхаус следующий пост. А то кожаным, в отличие от ИИ, тяжело читать лонгриды.

А что тут делает тетенька на синем фоне, спросите вы.
А это специально для вас, ловцы блох. Вот так сейчас выглядят кожаные на официальных корпоративных стримах самого Zoom. Но если бы я вам этого не сказал, вы бы развопились - липсинк говно, не попадает в речь, зубы смазаны, мимика мэртвая, двигается неестественно. В общем уже сейчас практически нельзя отличить пожатый стрим от нейроаватара. И не делайте вид, что сможете отличить.

@cgevent

AI - агрегатор про нейронки | ИИ | AI

28 Oct, 22:13


10 главных технологических тенденций 2025 по версии Gartner

Gartner представила 10 ключевых технологических трендов, которые, по мнению аналитиков компании, будут иметь решающее значение для организаций в 2025 году. Темы этих трендов охватывают широкую область, от автономного искусственного интеллекта (Agentic AI) до пространственных вычислений (Spatial Computing) и нейрологического усиления (Neurological Enhancement). Gartner считает, что эти тренды будут стимулировать значительные изменения и открывать новые возможности для руководителей информационных технологий в течение следующих десяти лет. В документе также представлены прогнозы Gartner о том, как эти тренды будут развиваться, как они повлияют на организации и как эти тренды должны быть учтены для планирования и стратегического развития.

— Агентский ИИ: Эта технология предполагает использование систем искусственного интеллекта, которые могут самостоятельно планировать и выполнять действия для достижения целей, заданных пользователем. Gartner прогнозирует, что к 2028 году по меньшей мере 15% повседневных рабочих решений будут приниматься автономно с помощью агентского ИИ, что открывает возможности для повышения производительности.

— Платформы управления ИИ: Эти платформы играют ключевую роль в управлении рисками и обеспечении безопасности при использовании ИИ. Они позволяют организациям устанавливать политики ответственного использования ИИ, обеспечивать прозрачность и подотчетность. Gartner прогнозирует, что к 2028 году организации, внедрившие такие платформы, столкнутся с на 40% меньшим количеством этических инцидентов, связанных с ИИ.

— Безопасность дезинформации: Эта новая категория технологий направлена на борьбу с распространением ложной информации. Gartner предсказывает, что к 2028 году 50% предприятий начнут использовать продукты и услуги, специально разработанные для решения проблем безопасности дезинформации.

— Постквантовая криптография: Эта технология обеспечивает защиту данных от рисков, связанных с дешифрованием с помощью квантовых компьютеров. Gartner прогнозирует, что к 2029 году достижения в области квантовых вычислений сделают небезопасным использование большинства традиционных методов асимметричной криптографии.

— Ambient intelligence (AmI) — Окружающий интеллект: Невидимый окружающий интеллект представляет собой крошечные смарт-теги и датчики, собирающие информацию и не заметные человеку. Такие решения бизнесу относительно просто обеспечить и внедрить. Gartner считает, что первые решения в области AmI будут использоваться в розничной торговле (проверка запасов на складах) и логистике.

— Энергоэффективные вычисления: Углеродный след сложных вычислений и обучения нейросетей становится всё заметнее. Ожидается, что к концу десятилетия появятся новые вычислительные технологии (вроде нейроморфных процессоров и оптических ускорителей), которые будут потреблять значительно меньше энергии.

— Гибридные вычислительные системы: Постоянно появляются новые вычислительные парадигмы: графические процессоры, интегральные схемы специального назначения (ASIC), квантовые и оптические вычисления. Гибридные системы объединяют различные механизмы вычислений и хранения данных для решения новейших вычислительных задач.

— Пространственные вычисления: Эта технология, использующая дополненную и виртуальную реальность, расширяет физический мир цифровыми возможностями. Gartner предсказывает, что к 2033 году рынок пространственных вычислений вырастет до 1,7 триллиона долларов.

— Полифункциональные роботы: Эти роботы, способные выполнять несколько задач, заменяют специализированных роботов, предназначенных для выполнения одной операции. Gartner прогнозирует, что к 2030 году 80% людей будут ежедневно взаимодействовать с интеллектуальными роботами.

— Нейрологическое усиление: Эта технология использует устройства для чтения и декодирования активности мозга, чтобы улучшить когнитивные способности человека. Gartner прогнозирует, что к 2030 году 30% работников умственного труда будут использовать технологии нейрологического усиления.

AI - агрегатор про нейронки | ИИ | AI

24 Oct, 15:59


Кто желает автоматизировать работу через нейросетки, ваша остановочка 😐

Anthropic обновила Claude 3.5 Sonnet, на основе которого вышел режим автономного управления компьютером (Claude Computer Use). Пускай бета, не чатится и не взаимодействует с Google, но она просто работает по задачам на компьютере.

В видео я попросил авторизироваться в дейтинге, дал свой лог и пароль, затем попросил поставить лайк 3 блондинкам. Человеческая задача, но её выполнила нейросеть. Нажала куда надо без ошибок. Даже подтвердила полиси, закрыла офферы и свайпала анкеты. Не быстро, 120 рублей по токенам, зато есть результат.

Для сравнения, чтобы такую автоматизацию сделать через код, нужно собрать адреса кнопок с верстки, добавить ограничения на ненужные окна, прикрутить анализ фото в текст, прописать алгоритм шагов и молиться, чтобы не всплыл отказ на одном из этапов. С Claude Computer Use можно сделать тоже самое без ныряния в код. Кстати, попробуйте:

1. Скачайте Docker и заведите аккаунт
2. Получите API ключ из Claude
3. Пропишите команду в терминале, убрав проценты и добавив ключ
export ANTHROPIC_API_KEY=%your_api_key%
docker run \
-e ANTHROPIC_API_KEY=$ANTHROPIC_API_KEY \
-v $HOME/.anthropic:/home/computeruse/.anthropic \
-p 5900:5900 \
-p 8501:8501 \
-p 6080:6080 \
-p 8080:8080 \
-it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest

4. Ловите челюсть, когда запустите

Прежде, чем это войдёт в рабочий мейнстрим, скорее всего ускорят процессы за счёт новых моделей. А ещё лучше — выкатят песочницу, где такое запускать можно в 3 клика ☺️

🤖 InNeuralNetwork

AI - агрегатор про нейронки | ИИ | AI

19 Oct, 07:46


Flux 1.1 неплохо справляется с политической сатирой. Фабиан, создатель gliff.app, платформы для генеративных nocode минаппов, запилил приложение, которое с помощью Gemini генерит идею рисунка, а Flux 1.1. - отрисовывает. Зачастую получается смешно, а опечатки увеличивают виральность.

Кроме того на gliff полно различных генераторов селфи, аватаров, комиксов, мемасов и даже коротких видео и гифов. Бесплатно доступно 20 генераций в день. Пользуйтесь.

А есть ли какие то картиночно-генеративные модели, которые бы нормально на русском писать могли? Никто не слышал?

Сергей Булаев AI 🤖 - об AI и не только

AI - агрегатор про нейронки | ИИ | AI

17 Oct, 12:10


Мы, сегодня, улетели на Пхукет, что бы одну, «отпускную» ночь провести в отеле, а завтра — лететь аэрофлотом в Россию на неделю. Прошу прощения у всех, кому сейчас не отвечаю. В субботу точно всем отвечу.

Продолжаю наслаждаться недавно купленным безлимитным доступом к Runway. Зачастую, получается, как я раньше и говорил, далеко не с первого раза.

Кстати, коллега Сергей, выпустил мини сравнение лидирующих сервисов ИИ видео генерации. Но моё ❤️ (и деньги) с Runway.

Сергей Булаев AI 🤖 - об AI и не только

AI - агрегатор про нейронки | ИИ | AI

17 Oct, 12:07


Pika: продолжают через мемы раскрывать возможности своего генератора видео v 1.5, который умеет в физику, чёткость движений, и высокое качество картинки.

В этот раз добавили эффекты:
* Crumble (разрушить)
* Deflate (спустить)
* Dissolve (дезинтегрировать ака ты чего наделал)
* Ta-Da (фокусы за 200)

Заодно прицепил прошлый трейлер V 1.5, чтобы все эффекты в наличии были в одном посте.

Pika правильно делают. Мемы это массадопшн для AI. Надо только бесплатный тариф как-то проработать, а то 3 дня на одну генерацию это так себе.

Твит
Сайт

AI - агрегатор про нейронки | ИИ | AI

17 Oct, 07:45


Это я играюсь с Pyramidal Flow Matching for Efficient Video Generative Modeling

Опенсорсным видеогенератором.

Пообщался с командой, завтра напишу подробнее.

Спойлер. Нет, вы пока ничего не сможете в нем сделать, но есть перспективы роста. Тренируют новую модель.

@cgevent

AI - агрегатор про нейронки | ИИ | AI

15 Oct, 20:40


Нейромемчик преобразился!

Так мне нравится больше 😅

ИИволюция

AI - агрегатор про нейронки | ИИ | AI

15 Oct, 14:33


Adobe: на мероприятии Max сделали несколько анонсов.

Генеративная модель Firefly теперь вшита в Premiere и может использоваться для расширения видео, создания B-роллов на основе картинок, или добавления эффектов.

Судя по черрипикам контекст видео для продолжения ухватывает хорошо, а вот по качеству пока MiniMax, Kling, MovieGen, и Runway лучше.

В бете нового премьера уже должно работать, но понадобится подписка Creative Cloud и скорее всего зарубежный IP. Вейтлист в генератор видео на сайте тут.

Фича Generative Fill вышла из беты и начинает широко внедряться в продукты компании. А генеративная стёрка обновилась и стала лучше удалять объекты с контента.

Пост
Видео с мероприятия

AI - агрегатор про нейронки | ИИ | AI

14 Oct, 13:25


🪖Можно ли доверить AI убивать людей?

Полетели коптеры, полетели сизые… На видосе выше анонс дронов Bolt и Bolt-M от компании Anduril Палмера Лаки. Это тот чувак, который сделал VR-шлемы Oculus, продал их запрещенной в России Meta, а потом занялся разработками для оборонной промышленности.

Эти дроны с AI, умеют следить за целью и так далее. Но в США, как пишет TechCrunch, сейчас вовсю идет дискуссия о том, можно ли доверить AI непосредственно убийство. Ну, чтобы AI не просто помогал, а непосредственно «нажимал на курок». Было бы странно, если бы эта дискуссия не возникла на волне хайпа вокруг AI.

И как раз Палмер Лаки один из тех, кто топит за максимальное использование AI. У противников есть мнение, что робот не должен решать, кому жить, а кому нет. На это Палмер Лаки заявил, что мина тоже не может отличить школьный автобус от танка. Но их же, мол, используют.

И ответственность человека вроде как все равно остается. Если раньше ответственность была за нажатие на курок, то с использованием AI ответственность будет за решение использовать такое оружие.

В США сейчас, как пишет TechCrunch, не используют полностью автономное оружие. Но не запрещают компаниями производить его и продавать в другие страны. При этом производители активно лоббируют, чтобы проникновение AI было как можно выше. Как пишет TechCrunch, главный страх в том, что Китай или Россия выкатят полностью автономное оружие.

Но вообще дискуссия интересная. Что думаете, нужно разрешать AI принимать решение об убийстве или нет?

@TheEdinorogBlog — тот самый канал про стартапы🦄

AI - агрегатор про нейронки | ИИ | AI

14 Oct, 10:06


@OpenAI выложили Swarm — лайтовую библиотеку для создания мульти агентных систем. Swarm предоставляет абстрактный слой для управления взаимодействием и передачей управления между агентами и не использует API Assistants.

Swarm не является официальным продуктом, создатели просят рассматривать как пример экспериментов по мотивам мультиагентного кукбука OpenAI (посмотрите, интересно)

Как оно работает:

1️⃣ Определите агентов, у каждого из которых есть свои инструкции, роль (например, "Агент по продажам") и доступные функции (будут преобразованы в JSON-структуры).

2️⃣ Определите логику передачи управления другому агенту на основе хода беседы или определенных критериев в функциях агента. Передача управления осуществляется простым возвращением следующего агента, которого следует вызвать в функции.

3️⃣ Контекстные переменные предоставляют начальный контекст и обновляются в ходе беседы для поддержания состояния и обмена информацией между агентами.

4️⃣ Функция run() клиента инициирует и управляет мультиагентной беседой. Для этого требуется начальный агент, сообщения пользователя и контекст, и возвращает ответ с обновленными сообщениями, контекстными переменными и последним активным агентом.

Инсайты:

🔄 Swarm управляет циклом взаимодействий агентов, вызовами функций и возможными передачами управления.
🧩 Агенты инкапсулируют инструкции, доступные функции (инструменты) и логику передачи управления.
🔌 Фреймворк не сохраняет состояние между вызовами, предоставляя прозрачность и тонкий контроль.
🛠️ Swarm поддерживает прямой вызов функций Python внутри агентов.
📊 Контекстные переменные позволяют управлять состоянием в ходе взаимодействий агентов.
🔄 Передачи управления между агентами позволяют динамически переключаться между специализированными агентами.
📡 Поддерживаются потоковые ответы для взаимодействия в реальном времени.
🔧 Гибкий и работает с любым клиентом OpenAI, например, Hugging Face TGI или моделями, размещенными на vLLM.

По мотивам, на видео парень строит RAG агента на базе Swarm

Сергей Булаев AI 🤖 - об AI и не только

AI - агрегатор про нейронки | ИИ | AI

14 Oct, 10:05


Воу! Как насчет поиграть в CSGO на нейронке?
После Google с его Doom AI так быстро начали появляться модели мира, и не просто с видео презентацией, а с репо на GitHub и возможностью развернуть это на своей локальной машине!

По сути, это генерация с интерактивным управлением. Там, конечно же, нет физики, поэтому, когда вы прыгаете, вас просто галлюцинируя уносит в небо.

Игра (или не знаю, как это назвать) запускается на 10 fps, изначально считается в очень маленьком разрешении, а потом апскейлится уже отдельным проходом. Но что меня поразило, это то, что сеть обучали всего на 87 часах игрового видео!
Кажется 25 год будет невероятным!

Подробнее тут
Сайт проекта

AI - агрегатор про нейронки | ИИ | AI

14 Oct, 09:54


На этой неделе в Китае, буду кидать интересные AI-решения и другие приколы из местных сервисов.

В JD - второй по размеру маркетплейс - встроен свой тик-ток на второй вкладке. Любое видео можно ставить на паузу, найти все товары на кадре и положить в корзину. Довольно круто!