Нейросеть дня @universe_ai Channel on Telegram

Нейросеть дня

@universe_ai


Авторские обзоры ИИ-инструментов несколько раз в неделю. По всем вопросам — @bitsak

Нейросеть дня (Russian)

Вы когда-нибудь задумывались о том, как искусственный интеллект влияет на нашу жизнь? Если да, то канал "Нейросеть дня" (@universe_ai) идеально подойдет для вас. Здесь вы найдете авторские обзоры ИИ-инструментов несколько раз в неделю. Этот канал призван помочь вам разобраться в том, какие технологии используются в создании искусственного интеллекта, как они работают и какие перспективы развития они открывают. nnКаждый пост в этом канале наполнен увлекательной информацией о последних достижениях в области искусственного интеллекта. Если вы хотите быть в курсе самого нового и интересного в мире нейронных сетей, то "Нейросеть дня" - ваш лучший выбор. nnЗадавайте свои вопросы, делитесь своим мнением и узнавайте все о ИИ вместе с нами! Для всех вопросов и предложений обращайтесь к администратору канала @bitsak.

Нейросеть дня

29 Oct, 11:59


Runway: раскатали публичный доступ к Act One, инструменту для переноса своей мимики на персонажей.

Специального оборудования не требуется — достаточно видео с собой. Похоже на LivePortrait... и скорее всего он и есть под капотом.

Runway предоставили гайд как добиться лучших результатов.

Стоит 10 кредитов/сек, минимум 50 кредитов на видео. Максимальная длина видоса 30 сек. В безлимитном тарифе есть Explore Mode.

Сайт
Гайд

Нейросеть дня

29 Oct, 11:59


«Выпьем за...», — как говорит автор моего канала про ИИ. Ребята из Runway уверенно приближают будущее, где полноценный фильм или мультфильм можно будет сделать командой из 2-3 человек при бюджете в несколько тысяч долларов. Вот как будет решаться задача анимации персонажей без Motion capture.

Мои старые обзоры Runway тут, и тут.

Нейросеть дня

20 Oct, 14:10


Шедеврум от Яндекса — простое бесплатное приложение для генерации изображений и видео

Большинство генераторов изображений недоступны для непрофессионалов, понимают только английский язык, не работают из России или похожи на панель управления самолётом. Нужно ли проходить через все круги ада, чтобы сгенерировать картинку для дружеского чатика или обложку для статьи? Кажется, нет!

Шедеврум (YandexART) — ИИ-приложение от Яндекса, позволяющее бесплатно генерировать изображения и видео. Описываете на русском, что хотите получить → выбираете формат → получаете своё изображение. Выдаёт очень приличное качество, умеет в фотореализм и фантазии, предлагает пять вариантов соотношения сторон (в т.ч. сторис и альбомный). А ещё там есть что-то типа ленты-фотостока, где можно посмотреть, что генерируют другие люди и какие запросы используют.

Что умеет Шедеврум:
1. Генерировать изображения по текстовому описанию на русском языке
2. Открывает доступ к фотостоку работ и промптов других людей
3. Даже генерирует простенькие видео на базе начального и конечного кадра
4. Скорее всего, под капотом там ещё YandexGPT переформулирует ваши «кожаные» запросы на понятный машине язык

Для доступа нужна почта на Яндексе (кажется, есть у всех). На сайте бесплатно даётся 70 изображений и 10 видео в день. В мобильном приложении нет ограничений вообще нет. Ну и никаких VPN, иностранных номеров и привязки карты.

Моё мнение:
Для мощных дизайнеров это конечно детская игрушка. А вот для обычных людей и любительских задач подходит прекрасно. ТОП за свои деньги)

P.S. Яндекс мне не платил (хотя, я бы не отказался). Просто очень радует, что у нас тоже умеют в Текст-ту-Картинка модели, респект всем причастным и спасибо за хороший продукт!

---
Авторские обзоры ИИ-инструментов несколько раз в неделю. Подпишитесь, чтобы идти в ногу со временем — https://t.me/universe_ai

Нейросеть дня

05 Oct, 11:07


HeyGen — сервис для создания ИИ-аватаров и генерации видео

Вы менеджер по коммуникациям в крупной компании, и вам частно нужно обращаться к сотрудникам от лица гендиректора. Он, само собой, вечно в командировках или занят. Какие у вас есть варианты: писать от его лица письма (никто не читает и не везде подходит), организовывать съёмку (долго, дорого и трудно) или... сделать его ИИ-аватар.

HeyGen — сервис для создании цифровых аватаров и видео с их участием. Решает проблему дорогого и долгого производства простого видеоконтента. Загружаете туда короткое видео для примера → нейросеть копирует внешность, голос и манеру говорящего → создаёте неограниченное кол-во видео на 175 языках. От вас требуется только написать текст, который должен произнести аватар.

И всё это «из коробки», т.е. вообще не требуется специальных знаний. А ещё можно использовать сотни готовых голосов и аватаров из библиотеки. Лица там, конечно, американские, зато много русских голосов.

Что умеет HeyGen:
1. Создавать видео с ИИ-аватарами на базе текстовых сценариев
2. Дублировать видео почти на все языки и накладывать субтитры
3. Управлять скоростью речи, паузами и эмоциями аватаров
4. Позволяет добавлять собственные фоны и текст на видео
5. Создавать динамические видео, когда спикер находится в движении и меняется фон (подходит для сторис)
6. Монтировать всё это во встроенном редакторе

В бесплатной версии можно создать одного аватара, три видео в месяц и выгружать их в качестве 720p. Минимальная подписка на месяц стоит $29, даёт три аватара, безлимит на кол-во видео (до 5 минут) и выгрузку в 1080p. Командный тариф за 89 долларов увеличивает продолжительность видео до 30 минут и открывает режим совместной работы Ещё есть план с выгрузкой в качестве 4к, но там уже сложные кастомные условия.

Из России и на русском языке работает, но платить можно только иностранной картой.

Мои мысли:
Это геймченджер. Технология ИИ-аватаров в целом и HeyGen в частности дозрели до массового использования. Да, видео не идеальны и иногда считывается, что там ненастоящий человек, но это уже вполне смотрибельно.

А если заглянуть немного дальше, то открываются перспективы реальной персонализации контента. Ведь если для создания видео тебе нужен только текст, ничего не мешает создать для каждого студента персональную версию лекции и для каждого сотрудника личное обращение от гендиректора.

Прикрепляю видео, которое я сгенерировал в HeyGen. На освоение редактора, подбор голоса и монтаж ушло пара часов, второе такое сделаю уже за 15 минут.

---
Авторские обзоры ИИ-инструментов несколько раз в неделю. Подпишитесь, чтобы идти в ногу со временем — https://t.me/universe_ai

Нейросеть дня

23 Sep, 22:36


Есть много деталей, которые нам еще предстоит выяснить, но ошибкой было бы отвлекаться на любую конкретную проблему. Глубокое обучение работает, и мы решим оставшиеся задачи. Мы можем многое сказать о том, что может произойти дальше, но главное — это то, что ИИ будет становиться лучше с масштабом, и это приведет к значительным улучшениям в жизни людей во всем мире.

Модели ИИ вскоре будут служить автономными персональными помощниками, выполняющими конкретные задачи от нашего имени, например, координируя медицинское обслуживание. В какой-то момент в будущем системы ИИ станут настолько хороши, что помогут нам создавать лучшие системы следующего поколения и совершать научный прогресс во всех областях.

Технологии привели нас от Каменного века к Сельскохозяйственному, а затем к Индустриальному. Отсюда путь к Эре интеллекта проложен благодаря вычислениям, энергии и человеческой воле.

Если мы хотим сделать ИИ доступным для как можно большего числа людей, нам нужно снизить стоимость вычислений и обеспечить их изобилие (что требует много энергии и микрочипов). Если мы не создадим достаточную инфраструктуру, ИИ станет очень ограниченным ресурсом, из-за которого будут вестись войны и который станет в основном инструментом для богатых.

Нам нужно действовать разумно и решительно. Наступление Эры интеллекта — знаменательное событие с очень сложными и чрезвычайно важными вызовами. История будет не только позитивной, но потенциал настолько огромен, что мы обязаны себе и будущему разобраться, как навигировать в рисках, стоящих перед нами.

Я верю, что будущее будет настолько ярким, что никто не сможет должным образом описать его сейчас; определяющей характеристикой Эры интеллекта будет массовое процветание.

Хотя это будет происходить постепенно, удивительные достижения — решение проблемы климата, создание космической колонии и открытие всей физики — в конечном итоге станут обыденностью. С практически неограниченным интеллектом и изобилием энергии — способностью генерировать великие идеи и воплощать их в жизнь — мы способны на многое.

Как мы видели с другими технологиями, будут и негативные стороны, и нам нужно начать работать уже сейчас, чтобы максимизировать преимущества ИИ, минимизируя его вред. Например, мы ожидаем, что эта технология может вызвать значительные изменения на рынках труда (как положительные, так и отрицательные) в ближайшие годы, но большинство работ будут меняться медленнее, чем думают многие, и у меня нет страха, что нам нечем будет заняться (даже если это не будет похоже на «настоящие работы» для нас сегодня). У людей есть врожденное желание создавать и приносить пользу другим, и ИИ позволит нам усиливать наши собственные способности, как никогда прежде. Как общество, мы снова окажемся в расширяющемся мире и сможем сосредоточиться на взаимовыгодном сотрудничестве.

Многие работы, которые мы выполняем сегодня, показались бы пустой тратой времени людям несколько сотен лет назад, но никто не оглядывается назад, желая быть фонарщиком. Если бы фонарщик мог увидеть мир сегодня, он бы счёл нынешнее процветание невообразимым. И если бы мы могли перемотать вперёд на сто лет от сегодняшнего дня, процветание вокруг нас показалось бы нам столь же невообразимым.

---
Авторские обзоры ИИ-инструментов несколько раз в неделю. Подпишитесь, чтобы идти в ногу со временем — https://t.me/universe_ai

Нейросеть дня

23 Sep, 22:36


Сэм Альтман (CEO OpenAI) опубликовал манифест о будущем человечества и последствиях развития ИИ. Это важный текст, почитайте!

Публикую в переводе ChatGPT o1-preview:

Эра интеллекта

В ближайшие десятилетия мы сможем делать вещи, которые нашим дедушкам и бабушкам показались бы магией.

Это явление не ново, но оно получит новое ускорение. Со временем люди стали значительно более умелыми; мы уже можем совершать то, что наши предшественники считали бы невозможным.

Мы стали более умелыми не из-за генетических изменений, а потому что пользуемся преимуществами общества, которое намного умнее и способнее, чем любой из нас; в важном смысле само общество является формой развитого интеллекта. Наши дедушки и бабушки — и поколения до них — строили и достигали великих вещей. Они внесли свой вклад в основу человеческого прогресса, от которого мы все получаем выгоду. Искусственный интеллект даст людям инструменты для решения сложных проблем и поможет нам развить эту структуру новыми элементами, которые мы не смогли бы придумать сами. Прогресс будет продолжаться, и наши дети смогут делать то, что мы не можем.

Это не произойдет сразу, но вскоре мы сможем работать с ИИ, который позволит нам достигать гораздо большего, чем без него; в конечном итоге у каждого из нас может быть персональная команда виртуальных экспертов в разных областях, работающих вместе, чтобы создавать почти всё, что можем представить. У наших детей будут виртуальные наставники, способные предоставить персонализированное обучение по любому предмету, на любом языке и в любом темпе, который им нужен. Мы можем представить себе похожие идеи для улучшения здравоохранения, возможности создавать любое задуманное программное обеспечение и многое другое.

С этими новыми возможностями мы можем достичь процветания, которое сейчас кажется немыслимым; в будущем жизнь каждого может быть лучше, чем чья-либо жизнь сейчас. Само по себе процветание не гарантирует счастья — существует немало несчастных богатых людей — но оно существенно улучшило бы жизнь людей во всем мире.

Если рассмотреть историю человечества с определённой точки зрения: после тысячелетий научных открытий и технологического прогресса мы научились плавить песок, добавлять некоторые примеси, располагать его с поразительной точностью в чрезвычайно малом масштабе в микрочипы, проводить через них энергию и в итоге получить системы, способные создавать всё более развитый искусственный интеллект.

Это может оказаться самым значимым фактом всей истории до сих пор. Возможно, что у нас будет сверхинтеллект через несколько тысяч дней (!); это может занять больше времени, но я уверен, что мы его достигнем.

Как же мы подошли к порогу следующего скачка в процветании?

Тремя словами: глубокое обучение сработало.

Пятнадцатью словами: глубокое обучение сработало, предсказуемо улучшалось с масштабом, и мы посвящали ему всё больше ресурсов.

Вот и всё; человечество открыло алгоритм, который действительно может изучить любое распределение данных (а точнее, базовые «правила», которые производят любое распределение данных). С поразительной точностью: чем больше доступно вычислительной мощности и данных, тем лучше он помогает людям решать сложные проблемы. Я обнаружил, что, сколько бы времени я ни проводил, размышляя об этом, я никогда по-настоящему не могу осознать, насколько это значимо.

Продолжение дальше в ленте →

Нейросеть дня

12 Sep, 17:33


OpenAI показали превью своей новой модели, и выглядит это как новый большой прорыв — эта языковая модель O1 решает сложные задачи во много раз лучше, чем привычные нам GPT, т.к. буквально “думает” прежде чем генерировать ответ. Меня как программиста эта картинка и радует, и пугает одновременно. Вот теперь, кажется, по-настоящему “началось”, сложно будет спорить, что LLM думает — она не просто думает, она сначала обдумывает как думать, потом думает и на базе этих мыслей генерирует ответ.

https://openai.com/index/learning-to-reason-with-llms/

Нейросеть дня

12 Sep, 17:33


Новая модель GhatGPT o1 в 8 раз лучше решает задачки по программированию и в 6 раз лучше по математике. В сравнении с текущей моделью GPT 4о, которая и без того делала это хорошо

Нейросеть дня

30 Jul, 10:04


Маленькая история становления и искренняя рекомендация от автора канала

В 2018 году я, на тот момент молодой и не очень успешный предприниматель, пришёл работать в Skyeng.

Пришёл с конкретной задачей:
Подсмотреть как устроен самый быстрорастущий стартап в России и перенять их образ мыслей.

В то время Skyeng собрал «золотую команду»: скупали с рынка самых движовых, мотивированных, умных и открытых. И эти ребята перформили так, как никто больше на рынке. Все три года, что я там работал, стартап-переросток с миллиардными оборотами увеличивался в 3 раза ежегодно.

Шалость удалась, скайенг дал мне такой личностный и карьерный рост, о каком ранее даже не помышлялось. Я полностью пересобрал свой образ мышления и познакомился с сотнями потрясающих людей.

К чему эта прелюдия про мою трудовую альма-матер?

У нас есть чатик бывших скайенговцев. Который, несмотря на холивары, является самым ценным каналом в моей телеграм-коллекции. Его участники уже не работают в Skyeng, но объединены культурой, где больше всего ценится ум и открытость.

Я не могу вас позвать в этот чатик, зато могу дать кое-что другое: держите папку ex-Skyeng-овцев. Там 28 каналов про всё на свете, и на каждый из них хочется подписаться дважды.

Я никогда раньше не рекомендовал подписываться в папки, не люблю всё это, но боже, какие офигенные люди там собрались!

Нейросеть дня

22 Jun, 11:24


Создавайте кинематографичные 5-секундные видео или оживляйте мемасы

Представим, что вы независимый контент-мейкер: музыкант, блогер, предприниматель. Вам хочется как-то заявить о себе в интернете: снять клип, видеоряд для YouTube или рекламный ролик. Какие у вас есть варианты это сделать, не потратив все свои деньги? Никаких! Порог входа в видоепродакшн настолько высок, что большинство предпочитает просто ничего не снимать.

Но вот полтора года назад выходит Runwan и Pika со своими трёхсекундными движущимися картинками, через год OpenAI релизит Sora, которая делает уже почти кино, но доступна только избранным. А недавно релизят модель Luma с бесплатным доступом для всех желающих и качеством почти как у Sora.

Luma Dream Machine — новая ИИ-модель для генерации кинематографичных видео из текста и изображений. На момент написания обзора умеет генерить 5-ти секундные ролики впечатляющего качества. Крепите исходную картинку → описываете, что должно произойти → получаете свой видос.

И конечно она галлюцинирует, нарушает законы физики, не дружит с текстурами, изменяет лица и т.п. Но по той же причине может выдавать немыслимые кадры, на которые не способна ни одна камера. А иногда всё настолько плохо, что даже хорошо.

Народ, само собой, сразу пошёл оживлять мемы и собирать короткометражки (сделал вам подборочку в комментариях к посту).

Что умеет Luma Dream Machine:
1. Создавать видео на базе ваших изображений и инструкций к ним
2. Создавать видео на базе произвольного текста (тут результат абсолютно непредсказуем)

Очень рекомендую поиграться, никогда ещё видеогенерация ни была так доступна. Например, придумайте альтернативное развитие сюжета фоток с друзьями.

В бесплатном демо-режиме можно сгенерировать не более 5 видео в день. За 120 видео в месяц нужно будет отдать $30, за 400 видео — $100, за 2000 видео — $400 в месяц.

---
Авторские обзоры ИИ-инструментов несколько раз в неделю. Подпишитесь, чтобы идти в ногу со временем — https://t.me/universe_ai

Нейросеть дня

10 Jun, 09:31


Что умеет Copilot Telegram Bot:
- Может ответить текстом на ваш текстовый запрос, как первая версия ChatGPT
- Умеет гуглить (точнее бингать), т.е. может сходить по вашей ссылке или найти какие-то материалы
- Пишет код и может в простую вёрстку (абзацы, жирный, курсив, цитаты)

Что не умеет:
- Не генерирует и не читает изображения
- Не умеет в графики, таблицы, сложную вёрстку ответов
- Не читает документы
- Нет параллельных диалогов и сохранённых чатов, забывает конктест после команды "restart"

Вывод:
Крутая штука для повседневного использования, особенно если доступ к полноценным продуктам требует усилий. Работа с текстом и кодом + гуглёж закрывают 90% всех кейсов. Я продвинутый пользователь со всевозможными подписками, но поставлю бота в закреп.

Ложка дёгтя всё же есть: требует один раз авторизоваться по номеру телефона, прикреплённому к Telegram. Если номер у вас российский или его нет совсем, доступ не дадут. Обойти этот забор всё же можно, сейчас полно сервисов для покупки виртуального зарубежного номера. Бесллатно даётся 30 запросов в день, платной подписки пока нет.

---
Авторские обзоры ИИ-инструментов несколько раз в неделю. Подпишитесь, чтобы идти в ногу со временем — https://t.me/universe_ai

Нейросеть дня

10 Jun, 09:31


Первый официальный телеграм-бот Copilot от Microsoft

Западные языковые модели (ChatGPT, Gemini, Claude) всё ещё заблокированы в России, барьер можно перелезть с помощью VPN и иностранного номера, но это требует определённых телодвижений. Я когда-то писал про концепцию когнитивной лёгкости: из-за отсутствия простого доступа к нейросетям мы чаще выбираем старый добрый гуглёж и «сделаю руками».

И тут руку помощи протягивет Microsoft Copilot со своим телеграм-ботом. Важно — дальше я буду рассказывать не про возможности Copilot (это большой продукт и заслуживает отдельного обзора), а именно про возможности их бота.

Copilot Telegram Bot — способ общаться с ChatGPT напрямую в телеграм, это официальный бот от Microsoft. Прекрасно подходит для ежедневного использования, не требует отдельной авторизации и VPN (но требует иностранный номер телефона). Вы скажете: «Ок, таких ботов уже тысячи,» и я отвечу: «Да, тысячи, но... есть разница между ботом от большой компании и маленькими посредниками.»

Четыре причины, почему я бы предпочёл бот от больших ребят:
1. Доступ в интернет — функция браузинга недоступна в API ChatGPT, а бот от Microsoft может сходить по вашей ссылке, а ещё к каждому ответу прикрепляет ссылки на источники
2. Безопасность — посредники могут видеть все ваши переписки с ботом, почти никто там не думает о защите данных, у больших компаний с этим намного лучше
3. Скорость — просто будет работать быстрее
4. Честные и понятные правила — 30 бесплатных запросов в день, никакой рекламы, токенов, подписок на канал и что там ещё придумывают для монетизации

(продолжение в следующем посте)

Нейросеть дня

01 Mar, 09:38


Google Gemini обновлённый конкурент ChatGPT

ChatGPT задал продуктовый стандарт — всё в одном чате: Можно загрузить фото рукописного текста, попросить перепечатать, объяснить, создать на основе этого изображение, найти недостающую информацию в интернете и превратить в другой документ. На бэке в это время несколько моделей дают друг другу задания, но мы этого не видим.

25 лет продуктовый стандарт задавал сам Гугл, а сейчас в роли догоняющего пытается отвоевать быстро формирующийся рынок ИИ-помощников. Около года назад они выкатили «сырого» Барда, недавно проапгрейдили его и переименовали в Gemini. Сделал для вас обзор этого сервиса.

Gemini — большая языковая модель (LLM) от Google. С продуктовой точки зрения копирует ChatGPT: в режиме чата вытворяет с текстом что угодно, может анализировать ваши и генерировать изображения. Утверждают, что качество генерации выше, чем у конкурентов, но проверить это сложно.

Стоит упомянуть два важных преимущества Gemini:
1. Максимальное контекстное окно в 1 млн. токенов (у ChatGPT 32к, у Claude 80к). Т.е. в рамках одного чата, теоритически, Gemini может хранить в памяти текст объёмом с Войну и мир
2. Интеграции в другие продукты Google. Например, прямо из чата создать документ или таблицу Docs, найти что-то в Gmail, сделать выжимку YouTube-видео. Если вы плотно сидите на сервисах Гугла, то Gemini с его бесшовными интеграциями выглядит намного интереснее одинокого ChatGPT с его недоделанным магазином расширений. Чуть позже сделаю отдельный разбор интеграций Gemini.

Что умеет Gemini от Google:
1. Вести осмысленный диалог в режиме чата на любую тему
2. Генерировать любые текстовые материалы
3. Считывать информацию с изображений
4. Генерировать изображения
5. Анализировать документы и сайты по вашей ссылке
6. Если просите найти какую-то информацию, указывает источники, откуда взял ответ
7. Из чата позволяет взаимодествовать другими сервисами Google — YouTube, Gmail, Drive, Docs, Maps, Flights, Hotels
8. И наоборот, можно открывать окно чата или давать задания Gemini из других сервисов Google

Что пока не умеет в сравнении с ChatGPT:
1. Нет открытого магазина приложений, интеграции только с сервисами Гугла
2. Нет настройки собственных чат-ботов
3. Нет сквозной памяти
4. Плохо генерирует изображения

Бесплатная версия Gemini из России открывается только с VPN. В США и некоторых других странах за $20 можно купить более мощную Gemini Advanced. Она имеет в 4 раза больше параметров (137 млрд против 34 млрд), т.е. будет выдавать более качественный материал. Те же 20 баксов, что и ChatGPT, но Гугл тут накинул плюшек в виде 2тб хранилища на диске Drive + первые два месяца бесплатно. Российские карты, как заведено, не принимают)

P.S. Сначала скептически отнёсся к анонсу, я уже тестил Bard ранее, и он не впечатлил. Но со второй попытки распробовал, даже подумываю изменить любимому ChatGPT и полностью переехать к Gemini. Очень подкупают интеграции с другими продуктами при сопоставимом качестве генерации.

---
Авторские обзоры ИИ-инструментов несколько раз в неделю. Подпишитесь, чтобы идти в ногу со временем — https://t.me/universe_ai

4,231

subscribers

15

photos

86

videos