[21/100] Витя Тарнавский

@singularityfm


Head of AI в T-Bank
Канал про будущее продуктов в AI
@the_real_jkee

[21/100] Витя Тарнавский

23 Oct, 09:05


В комментах очень верно напомнили что результат надо проверять.

Моя практика такая:
- если просить o1 проверять информацию и не выдумывать то по опыту ошибок почти нет
- помогает проверить пару чисел по источнику

В целом все как с живым консультантом, только быстро работает. Как по мне так получается предсказуемей и управляемый чем люди.

И напомню что все текущие решения это копилот а не замена человеку.

[21/100] Витя Тарнавский

23 Oct, 07:07


Как использовать o1 от OpenAI

o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ информации.

Давайте сразу на примере.

Допустим, мне понадобилось посмотреть на рынок FMCG в USA - доля онлайна и динамика, основные игроки, как всё вообще устроено.

Я на лету из головы пишу такой запрос:
I need a research about online fmcg market in USA, actual for 2023.
- main online players and shares in GMV and orders if possible - in table format
- distinction of main players in terms of product prop, region and any other interesting details
- what ecosystem they are part of if any
- any other important details
- share of online market and dynamics in 10 yrs span

all data should be from reliable sources, check it plz. and make the report compact


И получаю вот такой потрясающий отчет - посмотрите!

Этот отчет отлично структурирован, данные как я просил в табличке, все ссылки на источники есть, всё отвалидировано. Я получил ответ за 32 секунды. Я бы ковырялся 3 часа чтобы собрать все эти выводы.

Модель пока не умеет работать с вашими файлами, но полноценная o1 уже анонсирована, ждем. Тогда это станет x100 инструмент для исследовательско-консалтерской работы.

Используйте!

[21/100] Витя Тарнавский

22 Oct, 11:10


90% качество AI продуктов

ML основан на статистике и вероятностях - значит, в фундаменте заложена вероятность ошибки.

Ваш ассистент подумает что шенжень это женьшень и отправит человека на Алтай, ваша камера будет видеть в котенке qr-код, ваша Алиса будет реагировать на подлизу.

Вам нужна метрика качества. Хотя бы такая простая: какой процент реальных задач пользователей вы обрабатываете правильно. Без прибора качества развивать AI продукт не получится, можно только демку собрать.

В среднем люди считают что продукт работает «надежно» или «хорошо» если он имеет качество 90%+. Это может казаться как «много» но на самом деле это буквально «ошибся каждый десятый раз».

Обычно AI-метрик качества несколько и строить их довольно сложно.

Работа над AI продуктом это прежде всего правильное построение метрик качества и потом работа над получением заветных 90+. Вот здесь вам и нужны лучшие инженеры и лучшие умеющие работать с этим продакты.

[21/100] Витя Тарнавский

20 Oct, 10:15


Высокоскоростные поезда в Китае едут с сильным креном на поворотах чтобы держать скорость на повороте.

На видосе смотрите на горизонт, постарался его держать ровно. А поезд под углом.

Ощущения как на американских горках!

[21/100] Витя Тарнавский

18 Oct, 14:45


Прямо в навигаторе подсвечено сколько секунд до зеленого на светофоре. Будущее!

Это все та же государственная система обмена дорожной информации, к которой подключены все навигаторы.

[21/100] Витя Тарнавский

18 Oct, 08:05


Skyscanner, TripAdvisor и другие компании с картинки это на самом деле китайский trip.com - один из самых крупных международных travel-игроков.

Они инвестируют $400 млн в год на искусственный интеллект. При этом ассистент у них в приложениях косячит на глазах и вклада в бизнес не делает.

На поддержке, правда, 70%+ запросов они оптимизируют. Это как будто стандарт индустрии - 70% оптимизация поддержки за счет AI.

[21/100] Витя Тарнавский

17 Oct, 13:45


Каждая уважающая себя тех компания в Китае делает свой копайлот интерфейс похожий на UI ChatGPT. И непременно на своих моделях.

Причем не очень важно комплиментарно ли это их бизнесу ) Baidu, Alibaba, Tencent - все они.

Как я понял из разговоров, это такое доказательство что они действительно делают AI.

[21/100] Витя Тарнавский

17 Oct, 09:25


Не люди ищут товар, а товар ищет людей

Пропитываемся мудростью от ByteDance - создателей TikTok. Их ключевое стратегическое убеждение такое: раньше люди искали контент, а теперь контент ищет людей.

Раньше люди читали новости сами и искали информацию в интернете. А теперь всё наоборот: люди смотрят в тик-ток или другую трубу получения информации, а уже сервис сам подбирает информацию которая человеку нужна.

Они уже сделали это с контентом в TikTok и активно делают с товарами. Сегодня тик-ток это еще и крупная e-commerce площадка.

Кстати, tiktok в Китае это 700 млн dau 😅

[21/100] Витя Тарнавский

16 Oct, 12:59


Вот это прикольная тема. Автопилот Baidu видит участников движения не только своими глазами, но и глазами дорожных камер.

В Китае есть государственная система обмена информацией в которую можно воткнуться если ты делаешь self-driving. И это позволяет видеть в том числе участников движения вне зоны видимости. На видео - желтым цветом.

Они вместе с правительством двигаются к роевому управлению флотом. Это когда автопилоты знают друг про друга и управляются совместно. Если при этом убрать живых водителей, можно разогнать машины по скорости и при этом сделать движение безопасней.

[21/100] Витя Тарнавский

16 Oct, 07:21


Дикий замес вокруг Китая, Тайваня и чипов для AI

На фоне новостей о китайских учениях вокруг Тайваня давайте расскажу в чем суть дела.

TSMC (Тайвань) - безусловный лидер в производстве самых передовых чипов для AI. На их можностях работают Nvidia и AMD. Крупные фабрики есть еще у Intel и Samsung. Фактически все кто хотят производить крутые чипы идут в TSMC.

У TSMC есть запрет на производство для Китая топовых чипов, так как они используют технологии США.

Все производители чипов живут на оборудовании одной компании - нидерландская компания ASML. Она делает топовые станки для литографии, позволяющие делать чипы на 7nm и 5nm. Больше никто в мире не умеет, совсем.

Компания ASML может продавать станки только с разрешения голландского правительства. Которое это разрешение Китаю не дает (как и России, кстати).

То есть, для Китая:
- станки для производства закупать не дают;
- заказать производство не дают;
- покупать Nvidia тоже толком не дают;
- все эти заводы и станки находятся в Тайване который прямо рядом с Китаем и который они считают своей территорией.

И примерно все топовые чипы Nvidia производятся на этом же клочке земли.

Такой вот замес!

[21/100] Витя Тарнавский

15 Oct, 09:45


Alipay - главная платежная система страны с дневной аудиторией около 500 миллионов человек. Это три с половиной России каждый день.

А на второй вкладке у них - дорамы. Дорамы! Видеосериалы 🥴

Они вставляют их чтобы растить время в приложении и бороться с тиктоком.

Кажется, в этом месте цивилизация свернула не туда 😅

[21/100] Витя Тарнавский

14 Oct, 14:50


Baidu - 65% поискового рынка в Китае. Вот такую милую девушку ассистента имеют в приложении, с виду она довольно бесполезная.

Интересно другое.

Классический поиск в Китае не такой уж роскошный бизнес как в других странах. Очень закрытые экосистемы (WeChat, etc) не дают нормально искать по ним. Поиск как бизнес в Китае в 3-4 раза меньше чем в USA относительно остального технологического сектора в стране (o1 research)

В кулуарах рассказали что Baidu не очень на него ставят долгосрочно, хотя сейчас это основной источник дохода. Экосистемы будут закрываться все больше и трафик будет жить внутри этих экосистем. В Китае не строят perplexity, это не имеет смысла.

Компания перестраивается в технологического провайдера AI решений. Основные ставки: self-driving и ai b2b решения. Ресурсов вваливают много: 100к+ видеочипов имеются, например.

Интересно, насколько рынок РФ будет превращаться в рынок закрытых экосистем. Пока что это не очевидно.

[21/100] Витя Тарнавский

14 Oct, 07:40


На этой неделе в Китае, буду кидать интересные AI-решения и другие приколы из местных сервисов.

В JD - второй по размеру маркетплейс - встроен свой тик-ток на второй вкладке. Любое видео можно ставить на паузу, найти все товары на кадре и положить в корзину. Довольно круто!

[21/100] Витя Тарнавский

12 Oct, 08:48


Channel name was changed to «[21/100] Витя Тарнавский»

[21/100] Витя Тарнавский

12 Oct, 07:25


OpenAI выпустили MLE-bench - новый сложный бенчмарк для LLM.

По сути это бенчмарк в котором одни модели должны учиться обучать другие модели. Ну то есть обучать себе подобные системы.

o1 выбивает уже неплохие 16.9% бронзовых мест в их наборе Kaggle соревнований.

Что там по сингулярности?

[21/100] Витя Тарнавский

10 Oct, 07:30


Часто хожу по улице и говорю с gpt-4o advanced voice mode в режиме звонка.

Можно обсудить сложные темы на высоком уровне - знаний в ней больше чем в среднем человеке. Можно обсудить личные дилеммы и попросить поработать коучем. Можно попросить быть преподавателем по языку и корректировать английский.

Как замена тренировки разговорного языка уж точно лучше кожаных партнеров - знаний больше, всегда доступен, в любой момент трубку положил.

Long memory тоже есть и со временем погружать в контекст нужно все меньше. Все как с людьми.

Пользуйтесь!

[21/100] Витя Тарнавский

08 Oct, 07:01


Потрясающий материал по ML для обычных людей.

Если вы хотите разобраться в ML в деталях но без цели быть инженером - золотой контент для вас!

https://vas3k.blog/blog/machine_learning/

[21/100] Витя Тарнавский

07 Oct, 07:13


Здесь Альтман говорит про «one man unicorn» - компанию на 1B из одного человека. Классный тренд, я за ним слежу.

Образ будущего здесь такой: у руководителя бизнеса вместо работников шуруют цифровые агенты. Один разбирает заявки на почте, другой карточки товаров создает, третий бухгалтерию ведет, и так далее.

Те, кто пробовал такое делать, знают, что пока что сложновато получается: модели нестабильны, качество обеспечивать сложно, платформ удобных нет и так далее. Но все это улучшается.

А вот преимущества таких агентов неоспоримы:
- Работают стабильно и 24/7. Не болеют, не ходят в декрет
- Дешевле; и чем дальше тем более дешёвые
- Масштабируются по кнопке

Понятно что люди тоже останутся и это скорее комбинация. Тем более что физический мир роботам пока плохо удаётся.

Но уже понятно что новый навык управления и работы это создание, обучение и контроль таких агентов.

[21/100] Витя Тарнавский

25 Sep, 16:29


Изучаю платформы для построения LLM-приложений. Пока что с точки зрения продукта фаворит с отрывом это https://relevanceai.com/

У них есть:
- Очень понятная собиралка агентов и пайплайнов из агентов
- Великолепный конструктор тулов
- Возможность втыкаться кодом на питоне в тулы
- Классные интеграции и с каналами, и с внешними триггерами (а-ля запускать агента по тычку из zapier)

Ну и как все такие хорошие платформы они model agnostic

[21/100] Витя Тарнавский

21 Sep, 09:28


Очень прикольно следить за размышлениями o1 над сложной задачей.

Особенно на контрасте со мной, кожаным мешком. Мой chain of thoughts во-первых медленней в 100 раз, во-вторых на втором звене обычно заканчивается 😅