[27/100] Витя Тарнавский @singularityfm Channel on Telegram

[27/100] Витя Тарнавский

11 Feb, 07:23

Посидел с replit.com

Replit это нашумевший AI-агент для разработки. Он за тебя и код напишет, и базы подключит, и задеплоит, и запустит. Разработка по описанию задачи под ключ. Посмотрите видос!

Интересно, что изначально фаундеры затевали проект как инструмент облачной разработки и деплоя. Строят его почти 10 лет! Год назад они пивотнулись в агента и на этом дико взлетели. Тут классный подкаст с ними на Y Combinator

Всем очень советую попробовать, опыт-восторг из будущего 🥳

🤖

Эта штука за тебя step-by-step делает архитектуру, сетапит среду, тащит зависимости, пишет код, подцепляет базы и так далее. Сидишь и смотришь )

- Шикарный агентский сплит-скрин UX
Отличные интеграции
- Классные до-запросы вида «вот это ли ты хочешь»
- Сам находит и пытается чинить ошибки
- Встроенный деплой топчик

Но на паре практических кейсов replit у меня довольно слабо себя показал. Слишком сложные задачи пытается брать, в результате ломается. Нужно самому определить уровень сложности и делать step-by-step над replit, тогда в целом работает, но медленно получается.

Для меня это скорее демо "как всё будет в будущем" и классный пример агентского продукта с точки зрения интерфейса.

Но помним, что модели улучшаются, а планирование (ключевая задача здесь) в принципе недавно появились как популярная задача для Llm. Завтра будет лучше.

1,652

[27/100] Витя Тарнавский

06 Feb, 11:55

Cursor за два года вышел на $100M денег в год. Говорят, это быстрее любого другого ~~B2B~~ софта.

2,573

[27/100] Витя Тарнавский

06 Feb, 06:40

Собрал для вас табличку сервисов и фреймворков для создания агентских систем по уровню абстракции - от высокого и простого к низкоуровневым инструментам.

Если хотите посмотреть что такое агенты или сделать простую штуку, начинайте сверху. На уровень 4 спускаться примерно никогда не требуется.

Го в комменты где что забыл и у кого какой опыт

3,529

[27/100] Витя Тарнавский

04 Feb, 12:34

Telegram x LLM

Телеграм уже давно перестал быть ярким развивающимся продуктом, что расстраивает.

А прикиньте как можно было бы круто сделать мессенджер со всей мощью моделек?

Вот я придумал за 10 минут:

1. Омнимодальность голоса и текста: можно вводить голосом и будет текст, можно озвучить сообщение или чат, в любую сторону;
2. Поиск по смыслу, а не по словам рыжий с котом на аватарке, говорили про тачки. Поиск по медиа и файлам сквозной паспорт Маши;
3. Личный агент для структурирования информации и умеющий сканировать каналы/чаты вместо saved messages
4. Ассистент по-умолчанию в любом групповом чате;
5. Пуши с саммари iOS-style а не батарея бестолковых пушей;
6. Саммари-превью в списке чатов и автотреды по смыслу внутри чатов

Ребята, ну давайте там. 2025 год а у вас расшифровка голосовых кривая косая и по пять минут ждать 🌟

2,753

[27/100] Витя Тарнавский

03 Feb, 09:30

LLM OS

Очень мощная и близкая мне концепция. Первый раз услышал от Andrej Karpathy тут

Идея такая.

Текущий мир в котором мы живем это мир иконок приложений в твоём iPhone. Есть потребность - есть приложение под него.

Эта концепция уже трещит по швам. Супераппы это порождение недостатков этой архитектуры.

Представим мир LLM OS:

1. Ядро системы это твоя личная LLM с которой ты ведешь диалог и которая делает за тебя фоновые задачи;
2. Система имеет длинную память про тебя: кто ты, что тебе интересно и так далее. Это твой по-настоящему личный партнёр;
3. Все потребности реализованы в виде LLM Tools: функциональных ручек, которые предоставляют компании. LLM умеет их искать и вызывать;
4. Интерфейсы, конечно, есть. И полностью настраиваются через LLM. Компоненты могут предоставляться компаниями в составе Tools; но это скорее конструктор из фиче-виджетов чем текущие приложения. Некоторые считают что всё вообще будет через генерацию видео, с этим я скорее не согласен.

Как будто очень легко верится в такое будущее, я хочу в нем жить. Надеюсь, кто-то уже строит новый Apple.

3,080

[27/100] Витя Тарнавский

31 Jan, 07:31

No-code - всё!!111

(надо перестать читать бэкдор пхах)

Провел какое-то время с https://n8n.io/ - довольно популярной платформой для автоматизации с поддержкой агентов.

Она довольно классная - готовые интеграции, удобный дебаг и вообще. Можно быстро накидать бота или понятную автоматизацию. Сделали за пятнадцать минут с ребенком бота который генерит мемы для школьного проекта )

Разочарование приехало быстро. Как только я начал строить более сложное, стало там тесно. Ну, как обычно с такими платформами.

И тут я понял что в Cursor накидываю такое же буквально так же быстро. И без всяких глупых ограничений.

И не сказать что я там «пишу код» - я скорее говорю ей «допиши то», «допиши сё».

Новые инструменты разработки такие как Cursor и Replit настолько быстро позволяют создавать код, что изучение правил какой-либо no-code платформы уже того не стоит. И дальше это будет только обостряться.

Такие дела. Ставьте Cursor.

3,492

[27/100] Витя Тарнавский

29 Jan, 07:19

За новостями про новые супер пупер модели мы часто упускаем более важные в прикладной работе новые строительные блоки.

Perplexity уже довольно давно запустил Sonar: API к поиску. Выглядит ровно как апишка OpenAI, но эта штука ходит в интернет.

Это сильно недооцененная вещь.

Вот пару примеров из моей головы:
- Прокачать все отели, для каждого собрать хорошее описание. Вместо отелей подставь что угодно;
- На лету подтягивать агрегат свежих новостей на конкретную тему
- Собирать преимущества и недостатки товаров из обзоров для вашего маркетплейса;
- Подтягивать на лету решения из интернетов для проблем с любым оборудованием.

По сути, нормальный умный агрегатор интернета завернутый в API. За несколько центов за запрос.

Используйте.

3,294

[27/100] Витя Тарнавский

28 Jan, 10:25

Начались первые обещания закручивания гаек по GPU. Пока что в виде дополнительных тарифов на импортные GPU, призванных построить фабрики для производства чипов в США а не в Тайване.

Дальше будет веселее. США будет пытаться отобрать у Китая все потенциальные новые GPU. Для NVidia это порядка 20% бизнеса, между прочим.

И напомню про вот этот мой пост объясняющий ситуацию вокруг GPU и Тайваня.

2,800

[27/100] Витя Тарнавский

28 Jan, 09:44

На фоне истории вокруг DeepSeek меня активно спрашивают «а почему не мы?» - имея в виду то рынок РФ, то конкретно Т-Банк

Действительно, сравнимый объём железа у нас есть, мозги - тоже. Казалось бы, все есть!

Ну, не совсем.

Возможность построить модели такого уровня это сочетание большой мотивации и ресурсов у достаточно большого количества компаний. Это лотерея - DeepSeek выиграл, ещё 100 лаб проиграли.

В США компании это делают ради денег. Если ты сделал топовую модель, твоя компания вошла в первые ряды и оценивается очень дорого. С инженерами, кстати, похожим образом работает. У нас такого нет, рынок не оценит.

Китай пронизан национальной идеей великости Китая и «порвем США». Там инженеры реально хотят обогнать OpenAI ради страны. У нас такого среди инженеров сильно меньше. Кроме того, есть как минимум десятки компаний у которых есть достаточные ресурсы. В РФ их строго меньше пяти штук.

В результате получаем то что получаем. Еще и модель в мире не примут, и железо (даже такое как у китайцев) не объяснишь.

3,257

[27/100] Витя Тарнавский

27 Jan, 11:29

Channel name was changed to «[27/100] Витя Тарнавский»

0

[27/100] Витя Тарнавский

27 Jan, 11:18

Маленькая зарисовка про жизнь с Cursor

Надо было тут картинки перевести из webp в jpg. Я знаю как на маке конвертнуть одну (хотя зачем мне это знание), но мне нужно было восемь.

Я открыл Cursor и сделал скрипт на питоне буквально за 15 секунд. Просто сказал «сделай вот такую программу» и потом «сделай ее запускабельной», и всё.

Запустил, конвертнул, пошел довольный дальше.

Киберпанк какой-то 🤖

2,949

[27/100] Витя Тарнавский

25 Jan, 07:15

Что интересно про DeepSeek так это объем железа для обучения.

По официальному репорту, DeepSeek тренировался на кластере из 2k H800. Это смешной размер для таких задач. Это примерно в 50 раз меньше чем кластер для обучения любой большой модели в US.

Слухи ходят что они не раскрывают данные о реальном кластере. Китаю нельзя официально иметь кластера на H100 и других топовых картах любого крупного размера.

Я в Китае был сам и инженеры там лично говорят что кластера на 50-100к у них конечно есть. Раскрывать они их не могут.

С другой стороны, DeepSeek выпустили вместе с моделью подробный тех репорт с указанием размеров кластеров и так далее. И там все бьётся нормально - объёмы данных и времени вполне совпадают с объёмом железа, это подтвердили более-менее все лидеры индустрии.

Если это и правда возможно на кластере в 2k, значит и другие страны могут так же и стены в 100k кластера не существует.

3,876

[27/100] Витя Тарнавский

24 Jan, 07:16

Все посмотрели демку оператора от OpenAI? Круто же? Ну сырое, да - но это вопрос времени.

Прокомментирую отдельно про его удаленность, это важно.

Работает он внутри браузера на серверах OpenAI. То есть вам нужно логиниться удаленно в ваши сервисы, что стремновато. С приложениями совсем не будет работать, если они конечно ферму не решат делать. Также, ваша внутренняя сеть недоступна - например, с корпоративными ресурсами.

Как я вижу, дальше появляются:
- Локальные решения в виде приложения на десктоп чтобы не логиниться
- Operator для iOS/Android с "скрытым" экраном чтобы не логиниться в приложения
- Разные комбинации on-premise решений. Надо соединить это с чем-то вроде rdp и внутрикорпоративной фермой с локальными же моделями

Важно всё это потому что открывает путь к автоматизации действий которые не имеют API-интерфейса. В диком вебе можно сделать почти всё внешнее. В корпоративном вебе можно сделать почти все внутренние задачи.

3,528

[26/100] Витя Тарнавский

22 Jan, 07:55

Обзорная статья от McKinsey про AI в банковском секторе. С картинкой «нового» IT-стека.

Можно почитать, булшит умеренный, полезное есть. Из того что выцепил:

- Нужно перестраивать себя и принимать риски. Большинство игроков делают слабые безрисковые проекты - строят пару чат-ботов и суммаризацию. Настоящие львы перестраивают с нуля целые домены - например, привлечение.
Так и есть, так и есть

- Фокус. Предлагают выделить пару доменов которые реально повлияют и фокусироваться на них. Так и есть, обычно это поддержка и привлечение. Ну и developers productivity, как везде.

- AI-архитектура. Предлагают переделать всю архитектуру добавив большие слои и блоки примерно как на картинке. Тут они несколько перегибают и видимо продают себя, но и правда приходится много достраивать и менять.

- AI-агенты. Предлагают всем бежать строить агентные и мультиагентные системы для автоматизации. Это они имхо рановато, агентам до банковского продакшена еще нужно дорасти. Опять же, себя продают.

https://www.mckinsey.com/industries/financial-services/our-insights/extracting-value-from-ai-in-banking-rewiring-the-enterprise

4,050

[26/100] Витя Тарнавский

21 Jan, 07:24

Во время отпуска наконец-то дошли руки прочитать SITUATIONAL AWARENESS - 165-страничный документ про AI, AGI и как всё катится в сторону манхэттенского проекта.

Написал его Leopold Aschenbrenner - 22-летний инженер уволенный из OpenAI. Он был частью Superalignment Team - команды, занимающейся Safety, которую разогнали в прошлом году (вместе с Суцкевером). Уволился он тогда со скандалом - парень громко говорил что всё небезопасно и вы делаете угрозу человечеству и вообще одумайтесь.

Документ хорошо и аргументированно написан, с примерами, доказательствами и ссылками. Отчасти поэтому разлетелся и вызвал мощный резонанс.

Основная идея: Trust the trendline

Если пытаться сжать весь документ до основных идей, то:
- Мы прирастаем примерно x10 каждый год по мощности AI-систем и это четкий тренд — вы сейчас здесь;
- Это обгонит людей очень быстро, его прогноз: AGI к 2027 (как он это определяет оставлю вам на самостоятельное исследование);
- Как только будет построен устойчивый агент-AI-ресерчер начнется положительная обратная связь автоулучшаемой системы и кривая ещё загнется вверх;
- Пойдут необратимые экономические изменения;
- Подключаются государства, манхеттанский проект из текущих лабораторий и так далее.

Про моих любимых агентов он там тоже много пишет. Один из следующих шагов - AI-сотрудники на remote которые лучше чем люди.

Чтиво классное, я очень советую хотя бы первые две главы. И документ во многом исторический, очень резонансный. Классно что его написал молодой 22-летний парень.

3,880

[26/100] Витя Тарнавский

20 Jan, 07:47

Я вернулся из отпусков, скоро будет контент )

А пока что посмотрите спецвыпуск Private Talks со мной совместно с великими. Рассуждаем про то лишит ли AI всех работы или скорее наоборот.

Аузан мощь, Саша и Андрей крутейшие, очень рад что поучаствовал ❤️ Получилось очень хорошо.

https://www.youtube.com/watch?v=JV4wVLEpojw

3,188

[26/100] Витя Тарнавский

26 Dec, 07:17

Большой рассказ от Uber: что они наворотили за год в разработке с помощью LLM

Основные вещи:
- Code Assistants
- Автогенерация тестов
- (!) Автоперевод легаси Java кода на Kotlin с помощью LLM

Много деталей реализации, очень интересно. Особенно про автоперевод когда - ребята наворотили систему из ASL правил, LLM и human in the loop. Про агентов как способ реализации тоже есть.

Выводы классические: прототип делать легко, продакшен решение сложно.

Лучше смотрите видео: https://youtu.be/jp-fBw07r7c

4,814

[26/100] Витя Тарнавский

25 Dec, 08:54

Channel name was changed to «[26/100] Витя Тарнавский»

0

[26/100] Витя Тарнавский

25 Dec, 07:51

Один из активно обсуждаемых топиков сейчас это «AI агенты убьют SaaS». Говорят про это много и большие ребята. Например, CEO Microsoft, a16z, Y Combinator.

Обобщенный нарратив такой: в мире победивших агентов текущим SaaS точно не место и весь B2B SaaS рынок будет выглядеть иначе. Как именно - мнения разнятся.

В теме не так просто разобраться. Вытащил для вас из потока сознания интересные мысли.

Представим, что у нас мир победивших AI агентов. Агенты умеют решать интеллектуальные задачи, ходить в разные API и базы, реализовывать бизнес-логику и так далее. И все B2B взаимодействия будут делаться через таких агентов.

Тогда:

1. У каждого B2B сервиса будет представление в виде AI Tool.

2. SaaS компании которые продают бизнес-логику над базами данных теряют смысл, проще на своем агенте промпт над базой написать.

3. Агенты позволят не завязываться на интерфейсы SaaS решений так как есть более универсальный языковой формат и вообще не надо сажать людей. Например, saas бухгалтерия с интерфейсом перестанет быть нужна так как будет агент принимающий на вход текстовый запрос решающий эти же задачи сам.

4. Интеграционные усилия по внедрению драматически снижаются - не нужно изучать интерфейс очередного saas или подключать API.

5. Как следствие, падает конкурентный ров в виде vendor lock. А не как сейчас проекты «5 лет отказа от Siebel»

6. Появятся B2B Agents & Tools SaaS маркетплейсы которые сделаны чисто для агентов. Подключить бухгалтерский софт агент сможет и сам, найдя его на маркетплейсе и вызвав как tool. Это означает значительное снижение стоимости привлечения в SaaS.

Тема активно форсится разными участниками рынка как революция, но часто уходит в булшит бинго.

Я верю что революции тут быть. В мире победивших агентов любая услуга это tool, а любая логика это промпт.

4,314

[26/100] Витя Тарнавский

24 Dec, 07:24

Вышла отличная статья от Antrophic про агентов и как их строить.

В частности, хорошо расставляют по местам понятия Workflow и Agent.
- Workflow это заранее предопределенная последовательность действий. Я обычно называю пайплайн, надеюсь это правильно )
- Agent это система где LLM динамически определяет как именно будет решаться задача - какими инструментами, в каком порядке и так далее.

Полезно потому что каждый встречный-поперечный поставивший цикл while вокруг одного промпта уже называет своё решение "агент" и поднимает ещё $10M )

Статья классная, с базовыми принципами построения и пайплайнов и агентов.

https://www.anthropic.com/research/building-effective-agents

3,835

[26/100] Витя Тарнавский

20 Dec, 07:31

Пятничный контент )

Давно хотел пособирать end2end видосы.

Собрал драму про разочаровавшегося в человечестве квадробера 😅😽

Сюжет, видео, аудио - генерация. Chatgpt, dallie, runway, elevenlabs. Час работы всего.

На чем проще всего автоматизировать такой пайплайн, кто знает?

p.s. зацените голубя на втором кадре
просто на пофиг идет сквозь решетку 🐤

3,667

[26/100] Витя Тарнавский

19 Dec, 10:35

Почему стартапы нервничают перед 20-м декабря

Со стороны кажется что OpenAI своими релизами только и делает что закрывает компании выпуская какую-то обёртку вокруг своих же решений которая до этого была у стартапа. В целом, это правда.

Но гораздо больше стартапов делают ровно наоборот. Они создают продукт, инженерию и зачаток бизнеса, который на текущих моделях ещё не работает. Но будет работать если модели станут сильно круче.

Упомянутый выше Devin это как раз пример такой компании. Пока что кринж, но вот с GPT-5...

Поэтому куча стартапов нервно ждет последнего дня релизов OpenAI (это кстати уже завтра) и надеется что там будет GPT-4.5 или GPT-5 который сделает очередной прорыв и их стартап наконец-то заработает как надо.

А OpenAI может и не зарелизить. Пока что они горячую телефонную линию для ChatGPT запускают. Это вообще что? ))

2,953

[26/100] Витя Тарнавский

18 Dec, 11:08

Давайте посмотрим на Devin, это отличный пример агента. Стартап нашумевший, многие его отмечают, даже отец наш Karpathy.

Devin это такой джуниор девелопер-тиммейт. Работает полностью через slack.

Ты ему пишешь в slack как живому разработчику буквально "сделай вот этот таск" или "нашел баг, исправь". Он уходит читать доки, готовить код и делать пулл реквесты. И возвращается минут через 15 со словами "я сделяль". Можно потом комменты в гитхабе оставить на реквест и он их пойдет исправлять. Всё как с живым джуном!

У него всего три инструмента:
- Веб-браузер и внешний и для условной jira
- Консоль
- Редактор кода с гитхабом

Код получается по отзывам разработчиков вполне сносный. Лучше справляется с стандартными штуками, с всяким редким работает плохо. Ну, ожидаемо от llm-based инструмента )

Разработчикам Devin не очень нравится. Нет контроля над кодом, медленно, воркфлоу через slack, и вообще их это не очень усиляет. Любой синьёр знает что лучше ускорить себя на 10% чем получить джуна в команду ))

Интересен прайсинг. Ребята просят за Devin $500/month. Что очевидно сильно дороже того же Cursor ($20) или ChatGPT. Но ребята сравниваются с junior developer, и тогда такое сравнение по цене очень даже уместно - примерно в 10 раз дешевле )

Сейчас это, возможно, уже лучше чем типичный джун. Но технологии будут расти и такие штуки как Devin будут всё более надежные. А вот люди - вряд ли.

3,683

[26/100] Витя Тарнавский

18 Dec, 06:46

I'm back.
Я вернулся.

2,539

[26/100] Витя Тарнавский

17 Dec, 07:14

Наткнулся на отличное видео про AI-агентов от Andrew Ng аж 8-месячной давности.

Мой вольный пересказ вступления:

Если вас попросить написать эссе сразу и без ошибок, у вас скорее всего получится фигня. Но от LLM мы сейчас почему-то этого и ждем. Это ограничение не самих LLM, а механики выполнения работы.

Агентский подход это способ выполнения работы больше «как у людей» - медленней, с рефлексией, с планированием и внешними инструментами.

Если хотели базовое погружение в принципы агентов - посмотрите.

3,905

[26/100] Витя Тарнавский

13 Dec, 07:19

Зачем вы выкладываете модели в опенсорс? Никакой пользы в этом же для вас нет?

Это топ-1 вопрос ко мне в последние пару дней. Отвечаю.

1. Технологичность компании. Мы доказываем делом что мы один из лидеров индустрии. Для инвесторов это знак что мы не просто банк или экосистема, мы - технологическая компания, и можем в будущем строить новые технологические сервисы.

2. Знания и обратная связь. Мы получаем много фидбека и знаний с рынка. Это не про прямой вклад в модели, это про знания о том где ты находишься, что работает что нет, что получается строить на решениях а что нет. Сейчас мы общаемся практически со всей индустрией, этого не было без опенсорса.

3. Команда. Одно дело строить модели внутри, другое дело - строить решения влияющие на всю индустрию. Мотивация команды на небесах, и у нас хотят работать лучшие инженеры. И уже работают.

Когда смотришь на все это, понимаешь что решение однозначно верное.

И ещё. Мы правда хотим развивать индустрию, а не только работать на себя. Уже начали готовить для вас следующий Turbo ML Conf, ждите!

3,866

[26/100] Витя Тарнавский

11 Dec, 07:57

Выложили подробности на хабр https://habr.com/ru/companies/tbank/articles/865582/
Философия нашего подхода, много бенчмарков и детали по дообучению.

5,007

[26/100] Витя Тарнавский

11 Dec, 06:28

Большой день.
Мы выкладываем в опенсорс наши модели T-Lite и T-Pro. И эти модели просто топ 🥳

Мы увереннно выбиваем #1 среди открытых моделей по разным бенчам на русском. По MERA мы взяли #2 модель на русском ещё и включая все API, уступая только GPT-4o.

Это до-тренированный qwen-2.5 в размерах 7B и 32B. Мы провели большую работу: ~~свой токенизатор~~, глубокое до-обучение на русский и специфичные корпуса. Аккуратная работа с данными. Тех репорты будут.

Этот релиз является подтверждением нашего подхода в LLM: допретрен на базе опенсорса и затем файнтюн под доменные области. Получается значительно лучше результат и мы тратим на порядок меньше денег (не преувеличение).

Пользуйтесь. Модели для инженеров, рекомендуется дальнейший файнтюн, например через наш Turbo-Alignment.

Наш новый HF: https://huggingface.co/t-tech
Лидерборд по MERA: https://mera.a-ai.ru/ru/leaderboard
Остальные бенчи тоже есть, арены будут как прокрасятся

39,363

[26/100] Витя Тарнавский

10 Dec, 08:50

Я слышал легенды про это новое поколение ботов
И вот они ко мне пришли в комменты ))

3,794

[26/100] Витя Тарнавский

10 Dec, 07:09

Google достиг прорыва в квантовых компьютерах и закрыл две важные задачи: смог побороть ошибки при вычислениях и сделал классический бенчмарк для квантовых компьютеров. Это большой прорыв.

По такому случаю сижу разбираюсь в квантовых вычислениях, и обнаружил интересное )

Квантовые алгоритмы напоминают рецепты кузни Асгарда из Марвел.

The Mighty Deutsch-Jozsa Algorithm:
1. Summon 2 Qubits
2. Wield the Hadamard Gate
3. Consult The Oracle
4. Unleash Interference

И выглядит этот компьютер как кусок инопланетной технологии )

3,854

[26/100] Витя Тарнавский

06 Dec, 10:06

Пока все смотрят на релизы openai, большой кусок индустрии сидит на Conversations

Кирилл Петров - CEO Just AI - каждый год открывает классным keynote. Это его слайд про GenAI Value Chain - как ценность идет от производства GPU до конечных имплементаций. Пойнт такой же: пока что до верха не добрались, работаем посерединке.

У меня был похожий в докладе, но у Кирилла он сильно более полный.

И вообще ребята молодцы, классные.

4,681

[26/100] Витя Тарнавский

05 Dec, 12:30

Make AI Mediocre Again 🥴

А пока ждем анонсов от OpenAI посмотрите эту потрясающую фейк рекламу призывающую делать AI тупее и рассказывающую как )
Это реально может сработать пхаха

2 минуты великолепия https://www.youtube.com/watch?v=73rkqkTY6dA

3,202

[26/100] Витя Тарнавский

05 Dec, 07:26

Ого

3,102

[26/100] Витя Тарнавский

04 Dec, 16:57

Кусочек утекшей переписки Маска и Альтмана с 2015

Изначальная идея:
«Manhattan Project for AI» компания, решения которой будут принадлежать миру

Куда нас это привело? ) в обычные рамки капитализма🪙

А с завтрашнего дня от OpenAI пойдут анонсы, начинаем волноваться

2,717

[26/100] Витя Тарнавский

04 Dec, 09:45

AI-агенты это новое открытие года. За 2024 они успели пройти от насмешек до полноценного стека инструментов для построения агентов.

Сила здесь ещё и в понятном бизнес-эффекте: у тебя есть работа, ты её отдаешь агенту, понятно как оценить эффект. Это проще продавать в компаниях и измерять влияние.

LangGraph на коне, есть инструменты для памяти, качества, хостинга и так далее. Сами модели теперь учатся на агентские таргеты, новые релизы моделей целятся в лучшую работу в качестве агентов.

В 2025 все пойдут строить своих агентов и агентские платформы. Вот как про RAG сейчас из каждого утюга, скоро будет про AI-агентов.

3,278

[26/100] Витя Тарнавский

04 Dec, 08:29

RAG за 2024 успел не просто укорениться, а стать мейнстримом. Мы делаем RAG, они делают RAG, моя бабушка тоже делает RAG.

Говорил с директором одного крупного промышленного предприятия - и ему тоже оказывается нужен RAG. Зачем он не знает, но точно нужен!

Эта деталька хорошая и классно что ей научились пользоваться. Векторный поиск уже не вызывает удивлений, и даже многие знают что такое Pinecone и Qdrant.

Здесь индустрия перестраивается в умение правильно готовить данные чтобы их под RAG подкладывать.

2,547

[23/100] Витя Тарнавский

26 Nov, 07:19

Anthropic анонсирует Model Context Protocol, стандарт с открытым исходным кодом для подключения ИИ-помощников к источникам данных. На самом деле давно пора было — мы все так или иначе писали свои решения для таких подключений. Если его сейчас поддержит кто-то кроме Claude — это будет без преувеличений великое дело.

https://techcrunch.com/2024/11/25/anthropic-proposes-a-way-to-connect-data-to-ai-chatbots/

579

[23/100] Витя Тарнавский

26 Nov, 07:19

А вот и открытый протокол для интеграции от Antrophic подъехал. Надеюсь, будет один стандарт, а не три.

696

[23/100] Витя Тарнавский

26 Nov, 07:11

LLM Agent Toolkits - SDK из мира LLM

Агентам надо взаимодействовать с внешним миром, а компаниям и сервисам - встраивать свои вызовы в агентов. Давайте разберем на свежем примере.

Stripe выпустил Agent Toolkit - библиотеку для подключения своих платежных API к LLM-агентам. По-простому это набор API-методов с текстовым описанием для LLM что этот метод делает и какие параметры возвращает, в формате langchain и vercel.

Например, для метода создания инвойса у них вот такое несложное описание для LLM:

This tool will create an invoice in Stripe.

It takes one argument:
- customer (str): The ID of the customer to create the invoice for.

Это классный пример такого “LLM API” подхода для новой LLM Apps инженерии.
Что-то подобное стоит применять если вы внутри компании делаете платформу для LLM приложений и вам нужно все API "обтулить" или если вы делаете внешний API сервис который в перспективе полезен в агентских сервисах.

Ждем что через 5 лет примерно у каждого сервиса который будет куда-то интегрироваться будет и такая версия API. Название, как в случае RAG, может еще поменяться десять раз.

895

[23/100] Витя Тарнавский

22 Nov, 16:55

Всех с пятницей! )

1,676

[23/100] Витя Тарнавский

20 Nov, 08:44

Всё ещё не верится что мы делаем нашу большую продуктовую конференцию в мутаборе 😅

Готовим лучшие доклады на день и флешки с музыкой на вечер

На онлайн ещё можно записаться! https://producty24conf.tbank.ru/

2,292

[23/100] Витя Тарнавский

19 Nov, 07:20

Экосистемы и китайский сценарий

Все крупные игроки в РФ отстраивают свою экосистему. Строят от якорного продукта: Яндекс это поиск, Сбер и Т это банк, Озон это маркетплейс и так далее. Но дальше все строят всё остальное: банки, рекламу, маркетплейсы, самокаты и так далее. Дорамы 😅

Это рынок экосистем, или китайский сценарий.

Связано это, прежде всего, с маркетингом. Разница в стоимости привлечения на независимый апп и на приложение в супераппе - в разы. Даже если это отдельное приложение продукта экосистемы, все равно работает общий бренд, большие экосистемные бюджеты на привлечение и сквозная программа лояльности.

Влияет сильно помятый рекламный рынок: игроки ушли, новые не пришли. Гугла нет (вместе с YouTube).

Интересно, что долгосрочно проигрывает в таком сценарии именно поиск. В какой-то момент экосистемы перестают позволять по себе искат снаружи, да и людям это уже не нужно, проще внутри поискать. В Китае это уже наблюдается.

Следим за развитием событий, ваш @singularityfm

2,242

[23/100] Витя Тарнавский

15 Nov, 09:31

Perplexity запускает первые эксперименты с рекламой

Самый яркий new age альтернативный поиск запускает рекламную модель рядом с подписочной. В блоге ребята объясняют это через создание robust and self-sustaining business.

К сожалению, для информационных сервисов подписка не является устойчивой бизнес-моделью. Причина проста: люди привыкли что информация бесплатна. И это действительно так: Google бесплатный, Youtube открыт, и так далее. Хочешь построить большой бизнес на информации - делай рекламу или будешь бутиковым бизнесом для избранных и без денег на технологии.

Рекламу обещают делать явной (с пометками) и не передавать personal data рекламодателям. Это стандартные принципы хорошего тона.

Тестовый формат - первая позиция в доспрашиваниях. В сам ответ вставлять на текущий момент не хотят. Я видел у Bing эксперименты когда в первый кусочек текстового ответа вставляется sponsored кусок текста - это тоже вариант. Ещё бывают sponsored "карусельки" офферов в основном ответе.

Посмотрим, что придумает Яндекс.

2,436

[23/100] Витя Тарнавский

14 Nov, 11:51

Регистрация на физическое присутствие закончилась, но у меня есть немного билетов для вас )

Первым пяти кто напишет в комменты «хочу билет» выдам!
Только чур потом дойти!

upd: билеты улетели за минуту

2,077

[23/100] Витя Тарнавский

14 Nov, 08:47

Продукты 24!!! Большая продуктовая конференция от Т

В АРМЕ 😉, следующий четверг

Днём расскажу про AI и его влияние на все продукты
Вечером играю диджей-сет

Записывайтесь https://producty24conf.tbank.ru/

2,059

[23/100] Витя Тарнавский

13 Nov, 09:49

For an LLM of equivalent performance, the cost is decreasing by 10x every year

Фонд a16z выпустил короткую заметку в которой раскрывают простую идею: если смотреть в прошлое, то для фиксированной сложности модели стоимость инференса (одного вызова модели) падает примерно в 10 раз каждый год.

Это верно и для тех уровней сложности, которые тогда казались "невероятными". То есть можно сделать предположение, что сегодняшние "невероятные" уровни сложности моделей (e.g. 4o) так же будут дешеветь со скоростью в 10 раз в год.

Тут есть много оговорок: используют они MMLU (так себе мерило), график строят примерно по трём точкам, и вообще "всё слишком меняется".

Но я считаю пойнт вполне верным. И будущее в бизнесах и технологиях нужно планировать исходя из этого. Сегодняшние и завтрашние топовые модели будут стремительно дешеветь.

1,737

[23/100] Витя Тарнавский

13 Nov, 07:52

Большие модели нужны редко. На продакшне не нужны почти никогда.

Мы изначально взяли подход "SLM + допретрен + файнтюн": небольшие модели, делаем допретрен на русский и наш домен, и потом делаем файнтюны на задачи. Это быстрее, дешевле и эффективней.

Это слайд с рабочей встречи - на очередном новом кейсе выигрыш нашего файнтюна маленькой модели против GPT-4. С первого раза такой результат.

В данном случае файнтюн gemma9b, допретрен на русском языке + бизнес домене, с большим запасом перебивает gpt4. gpt4o на конкретно этой задаче работает ещё хуже, так бывает.

2,012

[23/100] Витя Тарнавский

12 Nov, 09:39

Смотрите, Lex Fridman и Vitalik Buterin говорят по-русски )
Точнее, Лёша Фридман и Виталик Бутерин

Обложка для видео 💀

https://www.youtube.com/watch?v=4XkFY9IsACk

1,939

[23/100] Витя Тарнавский

11 Nov, 14:28

Наши ребята записали интересный подкаст про LLM-приложения, агенты и инструменты вокруг LLM.

Если хотите понять как создавать решения на базе LLM и как на наших глазах строится новая инженерия которой раньше не было, идите смотреть.

Я считаю что это будущая инженерия почти любых инженерных решений. Новая база. Хотите оставаться актуальными - идите смотреть.

1,912

[23/100] Витя Тарнавский

08 Nov, 15:48

А еще вышло мое большое интервью для Kept

Рассказываю про наш подход к AI и объясню зачем мы опенсорсим модели. Получилось классно, доволен ) заходите почитать или послушать, есть и видео

2,281

[23/100] Витя Тарнавский

08 Nov, 13:50

Pieter Levels

Давайте расскажу про этого очень любопытного персонажа.

Pieter Levels на потоке клепает технологические бизнесы.
- в одиночку (!)
- без внешних инвестиций (!)
- уже 50+ бизнесов с общим годовым доходом в $3M+ (!).

А еще он живет с одним рюкзаком, ездит по всему миру, работает из всяких джунглей и проповедует номадский образ жизни. Батя номадского движения. Он строит digital nomad инфраструктуру вроде сравнения локаций для номадов и биржи для номад фрилансеров.

Активно использует самые разные copilot/automation инструменты чтобы делать всю работу его бизнесов без людей. У него нет наёмных сотрудников - это такая философия. Код пиши сам, работу автоматизируй и так далее.

В последнее время начал делать AI-workforce бизнесы вроде AI-менеджеров и AI-редакторов. Агенты, все как мы любим.

Почитать его проще всего в Твиттере и есть лонг интервью с Лексом

2,379

[23/100] Витя Тарнавский

07 Nov, 07:15

Записки из Лондона

Был в Лондоне, прошелся по менеджерам, фаундерам и инженерам из индустрии. Хайлайты:

1. Лондон – отличная база для международного предпринимательства.
UK-based это уважаемо, таймзона подходит для работы с разными локациями, инженеров из РФ выдернуть можно, инвесторы из US тоже доступны. Летать удобно.

2. AI индустрия умеренно развивается и представлена.
В Москве у меня свербящее ощущение, что где-то там люди творят великие дела: строят всякие опенэай и перплексити, делают стартапы и вообще уже в сингулярности.
Так вот. Лондон - такая же деревня но с work life balance и бумажной почтой ) Есть классные проекты и люди, ну они и в Москве есть.

3. Денег в найме в Лондоне платят мало. Если ты engineering manager и удачно устроился, будешь получать £300к+, из которых 40% уйдет в налоги. Это включая US бигтехи. В US на тех же позициях можно получать в 2+ раза больше. Выше £500k я так понимаю практически не бывает.
Я знаю что это многим может показаться как много, но с Лондонскими тратами это совсем не так.

4. Жить в Лондоне людям нравится :)
Как и везде много сложностей, основная - очень дорого жить, и это в сочетании с предыдущим пунктом. Но плюсов тоже много. Если есть деньги, минусы перекупаются.

Кстати, пасмурный Лондон это предрассудки - он сильно более солнечный чем Москва. Знаю ребят которые переехали и купили в Лондоне пятиэтажку (ребята привет😅)

Пишите в комментах где я обманул и дополняйте

2,143

[23/100] Витя Тарнавский

05 Nov, 09:35

The days are long but the decades are short

Сэм Альтман написал пост с жизненными принципами. Он классный, очень советую вчитаться.

Сэм написал его 10 лет назад. Ему было 30 лет. Через 8 месяцев после поста был основан OpenAI.

2,446

[23/100] Витя Тарнавский

05 Nov, 07:23

Channel name was changed to «[23/100] Витя Тарнавский»

0

[23/100] Витя Тарнавский

01 Nov, 12:11

https://toloka.ai/ - международный спин-офф проекта Яндекса по разметке.

Ребята переключились на GenAI: evaluation, разметка для SFT и RLHF. Это основной заработок компании сейчас.

Клиенты - компании, которые создают LLM с нуля или затачивают LLM на профессиональные домены. Толоку использует, например, Amazon.

Если раньше им были нужны дешевые разметчики которые могут отделять кошек от собак, то теперь нужны эксперты по вертикалям знаний. Стоимость заданий для таких специалистов может быть в 100 и 1000 раз больше. Фактически, ребята строят комьюнити экспертов в 40+ вертикалях знания. Вот тут можно посмотреть кого ребята ищут, оч интересно - медицина, финансы, логистика и так далее.

Ребята базируются в Амстердаме и являются частью Nebius Group

2,757

[23/100] Витя Тарнавский

31 Oct, 17:45

Ответ на вопрос «Кто такой Витя Тарнавский»

ChatGPT видит канал 😅 передаем привет в OpenAI

Но ответ Perplexity дает более полный.

2,311

[23/100] Витя Тарнавский

31 Oct, 17:18

Понеслась жара. OpenAI запустил поиск по интернету внутри ChatGPT.

Сразу подключили вертикальные инструменты: источники новостей, погоды, стоков и так далее. The way to go!

Пока что только в 4o модели.

https://openai.com/index/introducing-chatgpt-search/

2,413

[23/100] Витя Тарнавский

30 Oct, 19:43

red_panda это https://www.recraft.ai/ - стартап Анны-Вероники Дорогуш, создательницы CatBoost. Аня - соло фаундер, редкий тип фаундеров.

Ребята делают AI-генеративные инструменты для дизайнеров. И делают их командой лучших в мире инженеров.

В очередной раз видим что для создания AI-компании нужны топовые инженеры. Просто идеи и желания недостаточно.

Recraft go! ❤️

2,029

[23/100] Витя Тарнавский

30 Oct, 12:03

На text-to-image leaderboard на HF появилась загадочная red_panda которая рвёт все остальные модели аж на 29 elo points.

Это такой новый флекс: сначала выкладываешь анонимно модель которая всех рвет, держишь интригу неделю, и потом громко рассказываешь.

На этот раз будет чем гордиться 😉 (нет, не тбанк)
Как откроются - расскажу!

1,834

[23/100] Витя Тарнавский

30 Oct, 07:45

Это Лёша Шевенков, CTO Hepsiburada, одного из крупнейших маркетплейсов в Турции. Их недавно купил Kaspi, казахстанский банк. Такой вот странный мир!

Лёша смеется при упоминании проблем с высокой ключевой ставкой в РФ. В Турции ключевая ставка - 50% 😅

1,454

[23/100] Витя Тарнавский

26 Oct, 10:08

Gigachat MAX / YandexGPT 4.0

Вчера два наших технологических лидера представили новые версии своих моделей. Да, день в день 🤔

Gigachat MAX — 32k контекста, серьезный прогресс по MERA
YandexGPT 4.0 — 32k контекста, "близки к gpt-4o"

Сравнить довольно сложно. Сравниваются компании по своим бенчмаркам, прямого сравнения как будто избегают, третьих площадок для сравнения скорее нет. Даже перевод mmlu у двух компаний разный.

По относительным позициям в бенчах мой вывод такой: модели довольно похожи и находятся на уровне "несколько лучше llama 3.1 70b" и "значимо ниже gpt-4o". Собственно, это их два основных конкурента на нашем рынке.

Долгосрочно, мерило — это рынок. Бенчмарки хороши для первичной оценки, но на практике всё может быть иначе. Это как разработчиков сравнивать по их характеристикам.

Радуюсь за ребят - оба релиза выглядят крутыми, особенно на фоне дикого отставания в железе.

2,171

[23/100] Витя Тарнавский

25 Oct, 09:20

Недавно CPO Лавки Никита Толстой (🫂 hugs bro) запустил агрегатор для телеграм каналов за несколько часов в обнимку с ChatGPT. Код Никита в жизни в целом писал, что важно.

На этом примере хочу донести простую мысль, которую подсмотрел в Y Combinator подкасте про replit.

Способность программировать с развитием технологий открывает всё больше возможностей.

- 20 лет назад опытный разработчик мог написать за пару часов сортировку. Вроде полезно, но не очень.
- 10 лет назад средний разработчик собирал за несколько часов небольшой сайт, если имел в этом опыт. Уже сильно больше пользы для общества.
- Сегодня Никита Толстой может собрать интеллектуальный законченный продукт без знаний конкретных библиотек и подходов и вообще с другой работы.

Завтра - больше.

Да, немного про no-code. Возможно, когда-нибудь и придет фаза победившего low-code/no-code, но пока что практика скорее обратная. Самые классные платформы ускоренной разработки основаны на генерации кода и возможности с ним работать, а не на blackbox кубиках.

Учитесь программировать.

2,200

[23/100] Витя Тарнавский

24 Oct, 16:30

Мои любимцы Perplexity не отстают и недавно запустили advanced pro search в котором тоже есть multi-step reasoning как они его сами называют.

В духе Perplexity в ответе есть все источники (легко всё проверить). Правда, на этом запросе потеряли один важный источник.

Кто-нибудь знает бенч или арену где можно сравнивать результаты на подобных сложных кейсах?

1,787

[21/100] Витя Тарнавский

23 Oct, 09:05

В комментах очень верно напомнили что результат надо проверять.

Моя практика такая:
- если просить o1 проверять информацию и не выдумывать то по опыту ошибок почти нет
- помогает проверить пару чисел по источнику

В целом все как с живым консультантом, только быстро работает. Как по мне так получается предсказуемей и управляемый чем люди.

И напомню что все текущие решения это копилот а не замена человеку.

1,705

[21/100] Витя Тарнавский

23 Oct, 07:07

Как использовать o1 от OpenAI

o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ информации.

Давайте сразу на примере.

Допустим, мне понадобилось посмотреть на рынок FMCG в USA - доля онлайна и динамика, основные игроки, как всё вообще устроено.

Я на лету из головы пишу такой запрос:

I need a research about online fmcg market in USA, actual for 2023.
- main online players and shares in GMV and orders if possible - in table format
- distinction of main players in terms of product prop, region and any other interesting details
- what ecosystem they are part of if any
- any other important details
- share of online market and dynamics in 10 yrs span

all data should be from reliable sources, check it plz. and make the report compact

И получаю вот такой потрясающий отчет - посмотрите!

Этот отчет отлично структурирован, данные как я просил в табличке, все ссылки на источники есть, всё отвалидировано. Я получил ответ за 32 секунды. Я бы ковырялся 3 часа чтобы собрать все эти выводы.

Модель пока не умеет работать с вашими файлами, но полноценная o1 уже анонсирована, ждем. Тогда это станет x100 инструмент для исследовательско-консалтерской работы.

Используйте!

2,020

[21/100] Витя Тарнавский

22 Oct, 11:10

90% качество AI продуктов

ML основан на статистике и вероятностях - значит, в фундаменте заложена вероятность ошибки.

Ваш ассистент подумает что шенжень это женьшень и отправит человека на Алтай, ваша камера будет видеть в котенке qr-код, ваша Алиса будет реагировать на подлизу.

Вам нужна метрика качества. Хотя бы такая простая: какой процент реальных задач пользователей вы обрабатываете правильно. Без прибора качества развивать AI продукт не получится, можно только демку собрать.

В среднем люди считают что продукт работает «надежно» или «хорошо» если он имеет качество 90%+. Это может казаться как «много» но на самом деле это буквально «ошибся каждый десятый раз».

Обычно AI-метрик качества несколько и строить их довольно сложно.

Работа над AI продуктом это прежде всего правильное построение метрик качества и потом работа над получением заветных 90+. Вот здесь вам и нужны лучшие инженеры и лучшие умеющие работать с этим продакты.

1,577

[21/100] Витя Тарнавский

20 Oct, 10:15

Высокоскоростные поезда в Китае едут с сильным креном на поворотах чтобы держать скорость на повороте.

На видосе смотрите на горизонт, постарался его держать ровно. А поезд под углом.

Ощущения как на американских горках!

1,512

[21/100] Витя Тарнавский

18 Oct, 14:45

Прямо в навигаторе подсвечено сколько секунд до зеленого на светофоре. Будущее!

Это все та же государственная система обмена дорожной информации, к которой подключены все навигаторы.

1,985

[21/100] Витя Тарнавский

18 Oct, 08:05

Skyscanner, TripAdvisor и другие компании с картинки это на самом деле китайский trip.com - один из самых крупных международных travel-игроков.

Они инвестируют $400 млн в год на искусственный интеллект. При этом ассистент у них в приложениях косячит на глазах и вклада в бизнес не делает.

На поддержке, правда, 70%+ запросов они оптимизируют. Это как будто стандарт индустрии - 70% оптимизация поддержки за счет AI.

1,873

[21/100] Витя Тарнавский

17 Oct, 13:45

Каждая уважающая себя тех компания в Китае делает свой копайлот интерфейс похожий на UI ChatGPT. И непременно на своих моделях.

Причем не очень важно комплиментарно ли это их бизнесу ) Baidu, Alibaba, Tencent - все они.

Как я понял из разговоров, это такое доказательство что они действительно делают AI.

1,793

[21/100] Витя Тарнавский

17 Oct, 09:25

Не люди ищут товар, а товар ищет людей

Пропитываемся мудростью от ByteDance - создателей TikTok. Их ключевое стратегическое убеждение такое: раньше люди искали контент, а теперь контент ищет людей.

Раньше люди читали новости сами и искали информацию в интернете. А теперь всё наоборот: люди смотрят в тик-ток или другую трубу получения информации, а уже сервис сам подбирает информацию которая человеку нужна.

Они уже сделали это с контентом в TikTok и активно делают с товарами. Сегодня тик-ток это еще и крупная e-commerce площадка.

Кстати, tiktok в Китае это 700 млн dau 😅

1,209

[21/100] Витя Тарнавский

16 Oct, 12:59

Вот это прикольная тема. Автопилот Baidu видит участников движения не только своими глазами, но и глазами дорожных камер.

В Китае есть государственная система обмена информацией в которую можно воткнуться если ты делаешь self-driving. И это позволяет видеть в том числе участников движения вне зоны видимости. На видео - желтым цветом.

Они вместе с правительством двигаются к роевому управлению флотом. Это когда автопилоты знают друг про друга и управляются совместно. Если при этом убрать живых водителей, можно разогнать машины по скорости и при этом сделать движение безопасней.

1,675

[21/100] Витя Тарнавский

16 Oct, 07:21

Дикий замес вокруг Китая, Тайваня и чипов для AI

На фоне новостей о китайских учениях вокруг Тайваня давайте расскажу в чем суть дела.

TSMC (Тайвань) - безусловный лидер в производстве самых передовых чипов для AI. На их можностях работают Nvidia и AMD. Крупные фабрики есть еще у Intel и Samsung. Фактически все кто хотят производить крутые чипы идут в TSMC.

У TSMC есть запрет на производство для Китая топовых чипов, так как они используют технологии США.

Все производители чипов живут на оборудовании одной компании - нидерландская компания ASML. Она делает топовые станки для литографии, позволяющие делать чипы на 7nm и 5nm. Больше никто в мире не умеет, совсем.

Компания ASML может продавать станки только с разрешения голландского правительства. Которое это разрешение Китаю не дает (как и России, кстати).

То есть, для Китая:
- станки для производства закупать не дают;
- заказать производство не дают;
- покупать Nvidia тоже толком не дают;
- все эти заводы и станки находятся в Тайване который прямо рядом с Китаем и который они считают своей территорией.

И примерно все топовые чипы Nvidia производятся на этом же клочке земли.

Такой вот замес!

1,606

[21/100] Витя Тарнавский

15 Oct, 09:45

Alipay - главная платежная система страны с дневной аудиторией около 500 миллионов человек. Это три с половиной России каждый день.

А на второй вкладке у них - дорамы. Дорамы! Видеосериалы 🥴

Они вставляют их чтобы растить время в приложении и бороться с тиктоком.

Кажется, в этом месте цивилизация свернула не туда 😅

1,677

[21/100] Витя Тарнавский

14 Oct, 14:50

Baidu - 65% поискового рынка в Китае. Вот такую милую девушку ассистента имеют в приложении, с виду она довольно бесполезная.

Интересно другое.

Классический поиск в Китае не такой уж роскошный бизнес как в других странах. Очень закрытые экосистемы (WeChat, etc) не дают нормально искать по ним. Поиск как бизнес в Китае в 3-4 раза меньше чем в USA относительно остального технологического сектора в стране (o1 research)

В кулуарах рассказали что Baidu не очень на него ставят долгосрочно, хотя сейчас это основной источник дохода. Экосистемы будут закрываться все больше и трафик будет жить внутри этих экосистем. В Китае не строят perplexity, это не имеет смысла.

Компания перестраивается в технологического провайдера AI решений. Основные ставки: self-driving и ai b2b решения. Ресурсов вваливают много: 100к+ видеочипов имеются, например.

Интересно, насколько рынок РФ будет превращаться в рынок закрытых экосистем. Пока что это не очевидно.

1,455

[21/100] Витя Тарнавский

14 Oct, 07:40

На этой неделе в Китае, буду кидать интересные AI-решения и другие приколы из местных сервисов.

В JD - второй по размеру маркетплейс - встроен свой тик-ток на второй вкладке. Любое видео можно ставить на паузу, найти все товары на кадре и положить в корзину. Довольно круто!

1,812

[21/100] Витя Тарнавский

12 Oct, 08:48

Channel name was changed to «[21/100] Витя Тарнавский»

0

[21/100] Витя Тарнавский

12 Oct, 07:25

OpenAI выпустили MLE-bench - новый сложный бенчмарк для LLM.

По сути это бенчмарк в котором одни модели должны учиться обучать другие модели. Ну то есть обучать себе подобные системы.

o1 выбивает уже неплохие 16.9% бронзовых мест в их наборе Kaggle соревнований.

Что там по сингулярности?

1,785

[21/100] Витя Тарнавский

10 Oct, 07:30

Часто хожу по улице и говорю с gpt-4o advanced voice mode в режиме звонка.

Можно обсудить сложные темы на высоком уровне - знаний в ней больше чем в среднем человеке. Можно обсудить личные дилеммы и попросить поработать коучем. Можно попросить быть преподавателем по языку и корректировать английский.

Как замена тренировки разговорного языка уж точно лучше кожаных партнеров - знаний больше, всегда доступен, в любой момент трубку положил.

Long memory тоже есть и со временем погружать в контекст нужно все меньше. Все как с людьми.

Пользуйтесь!

2,417

[21/100] Витя Тарнавский

08 Oct, 07:01

Потрясающий материал по ML для обычных людей.

Если вы хотите разобраться в ML в деталях но без цели быть инженером - золотой контент для вас!

https://vas3k.blog/blog/machine_learning/

8,180

[21/100] Витя Тарнавский

07 Oct, 07:13

Здесь Альтман говорит про «one man unicorn» - компанию на 1B из одного человека. Классный тренд, я за ним слежу.

Образ будущего здесь такой: у руководителя бизнеса вместо работников шуруют цифровые агенты. Один разбирает заявки на почте, другой карточки товаров создает, третий бухгалтерию ведет, и так далее.

Те, кто пробовал такое делать, знают, что пока что сложновато получается: модели нестабильны, качество обеспечивать сложно, платформ удобных нет и так далее. Но все это улучшается.

А вот преимущества таких агентов неоспоримы:
- Работают стабильно и 24/7. Не болеют, не ходят в декрет
- Дешевле; и чем дальше тем более дешёвые
- Масштабируются по кнопке

Понятно что люди тоже останутся и это скорее комбинация. Тем более что физический мир роботам пока плохо удаётся.

Но уже понятно что новый навык управления и работы это создание, обучение и контроль таких агентов.

2,337

[21/100] Витя Тарнавский

25 Sep, 16:29

Изучаю платформы для построения LLM-приложений. Пока что с точки зрения продукта фаворит с отрывом это https://relevanceai.com/

У них есть:
- Очень понятная собиралка агентов и пайплайнов из агентов
- Великолепный конструктор тулов
- Возможность втыкаться кодом на питоне в тулы
- Классные интеграции и с каналами, и с внешними триггерами (а-ля запускать агента по тычку из zapier)

Ну и как все такие хорошие платформы они model agnostic

3,202

[21/100] Витя Тарнавский

21 Sep, 09:28

Очень прикольно следить за размышлениями o1 над сложной задачей.

Особенно на контрасте со мной, кожаным мешком. Мой chain of thoughts во-первых медленней в 100 раз, во-вторых на втором звене обычно заканчивается 😅

2,893

[21/100] Витя Тарнавский

17 Sep, 17:13

В свежем исследовании от ИТМО мы вошли в топ-3 компаний, вкладывающихся в Open Source в AI! В честь этого хочется еще раз упомянуть некоторые из наших разработок:

🏂T-Lite – наша LLM (а также Instruct версия)
⚡️ETNA – мульти-тул для Time-Series
🐊Research – множество репозиториев, которыми мы подкрепляем наши научные исследования
🐖Turbo Alignment – библиотека LLM alignment с реализацией широкого спектра методов

Если вы вдруг что-то из этого пропустили, то самое время накинуть звездочек и попробовать заиспользовать у себя.

Исследование опубликовано здесь.

2,702

[21/100] Витя Тарнавский

13 Sep, 07:07

Ниже цитата про крутость моделей от CEO Perplexity. Модели не важны, важен фокус на опыт пользователя.

Основная модель perplexity, кстати, это дообученная llama.

Я очень рекомендую весь подкаст

Lex Fridman: So in the future, you hope your model to be the dominant or the default model?
Aravind Srinivas: We don’t care.
Lex Fridman: You don’t care?
Aravind Srinivas: That doesn’t mean we are not going to work towards it, but this is where the model-agnostic viewpoint is very helpful. Does the user care if Perplexity has the most dominant model in order to come and use the product? No. Does the user care about a good answer? Yes. So whatever model is providing us the best answer, whether we fine-tuned it from somebody else’s base model or a model we host ourselves, it’s okay.
Lex Fridman: And that flexibility allows you to-
Aravind Srinivas: Really focus on the user.

3,256

[21/100] Витя Тарнавский

11 Sep, 12:43

Привет, я ищу легенду.

Я ищу CPO на AI пользовательские продукты в Т-Банк. Строить ассистенты, умные камеры, поиски и прочие продукты будущего на базе AI.

Позиция искренне очень крутая - топовая команда, топовые технологии, масштаб всей компании и шире, и много свободы.

Описание тут

Если вдруг знаете кого посоветовать - тоже пишите.

Писать напрямую мне

2,927

[21/100] Витя Тарнавский

30 Aug, 14:23

Смотрите какие ребята интересные - создание приложений и воркфлоу на базе любых моделей с помощью "программирования на тексте" - своеобразной маркдаун-разметкой.

Видео всё объясняет

Думаю, большая часть текущей разработки уйдет в подобные решения.

https://www.wordware.ai/

2,665

[27/100] Витя Тарнавский

[21/100] Витя Тарнавский (Russian)

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[27/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[26/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[23/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский

[21/100] Витя Тарнавский