ChillHouse @chillhousetech Channel on Telegram

ChillHouse

12 Feb, 13:59

Удалось попасть на закрытый ивент в Париже, где выступал CEO Anthropic - Dario Amodei. В целом он достаточно бегло пересказал свою статью в блоге последнюю, но дал отличный спойлер что ожидать от новой модели Anthropic. Попозже напишу как ивент закончится.

Update: ну что ж Дарио привел достаточно развернутый пример того, что человек сам выбирает когда думать над задачей, а когда отвечать быстро. И он очень удивлен что есть «думающие» модели и есть которые мол отвечают сразу. Он намекнул что в новой модели от Anthropic модель будет сама принимать решение думать или нет. Это прям то что надо. Хоть кто-то не делает все ради того, чтобы выкатиться ради метрик на бенчах.

1,157

ChillHouse

11 Feb, 09:40

Привет вашим агентам. Как дела?

Короче, я давно вещаю, все эти ваши контексты в миллион токенов и так далее фигня. Скажем так, чисто в теории мое ощущение что после 10к там драматически падает качество, ну и вот подтверждение подкатило.

А теперь эти «уникальные» данные/знания можно применить к агентам по продажам, агентам по чему угодно и подумать «когда же AI заменит человека на рабочем месте?». Как говорится, вашему агентскому стартапу на заметку.

1,713

ChillHouse

10 Feb, 21:01

Ну это одной строкой: Маск хочет там за почти 100 ярдов купить контроль над OpenAI и Франция так же в датацентры кладет почти 100 ярдов. Веселое время однако.

1,689

ChillHouse

10 Feb, 15:30

Ого какие темы постит Anthropic. Не могу не поделиться.

Ребята выпустили исследование как же используется AI сейчас и каков его экономический вклад (хотя тут я не очень понял). Цифры крайне занимательные. Картиночки приложу.

Основные выводы:
- большая часть использования(36%) AI приходится на задачи связанные с technical documentation etc и software development (кто бы мог подумать, да?)
- небольшой скос в сторону именно не полной автоматизации, а так называемой аугументации задач, это когда вы проверяете или дополняете задачу с помощью AI (я думаю разрыв в сторону аугументации будет расти очень сильно)
- большая часть задач которые решаются категоризированы к профессиям среднего/высокого достатка. И практически ничего с самыми низкими и высоко оплачиваемыми ролями. Тут я считаю просто скос из-за аудитории, которая использует их Claude. Вряд ли дворники или CEO доверяют свои задачи AI. Пока что.

Крайне советую прочесть, дает много инсайтов как и по областям применения и того, что действительно может работать.

Я все так же считаю:
- полная автоматизация с помощью агентов будет очень нескоро даже простых задач (см как же быстро вошли в жизнь self driving cars)
- все больше применения будет в аугументации задач и улучшении результатов (а-ля инструмент помощи)
- агенты == зло, базовые автоматизации круть (отдельные блоки в процессах, latency, качество определенных решений - условно замена старой технологии на новую)

1,705

ChillHouse

10 Feb, 13:37

Рубрика «прочитано, но не до конца понято». Поехали.

1/ тут DeepMind запустили в свет работу, возможно на первый взгляд не самую примечательную, но как мне кажется важную. Они поднимают вопрос «а какую систему вообще можно назвать агентской», а значит «применить reenforcement learning».

2/ Тот же DeepMind выложил труд «How to scale your model» о том как работает deep learning на уровне железа и передачи данных, каким образом происходит масштабирование мощностей на это все дело и эффективности вычислений. Просто must read для тех, кто хочет глубоко понимать а нафига тут датацентры и в чем фишка у DeepSeek.

3/ для хардкорных читателей, хотя блин и так один хардкор что-то выше, есть прекрасная статья о том как работает градиентный спуск и почему импульс в этой истории как концепт работает. Короче так на заметку. Потому что это поворотный момент в deep learning в целом.

4/ немного про китайскую экосистему технологических компаний

5/ для всех кто целиком пропустил и не понимает что за LLM - 200 страниц с нуля до конца (теория в основном)

6/ Андрей Карпаты 3 часа LLM для инженеров с нуля - рекомендую (практика в основном)

7/ редкое видео основателя musically (он же тикток в будущем) о росте, пользователях и так далее. Кладезь!

1,708

ChillHouse

09 Feb, 19:18

Воскресное. Что же читают партнеры одной из самых влиятельных и больших венчурных фирм A16Z.

1,823

ChillHouse

06 Feb, 12:17

Давно хотел написать про такое понятие в мире продакт менеджеров современности как «культура оптимизации конверсий».

На самом деле для всех полезно. Часто когда общаюсь с лидерами продуктов или СЕО стартапов (а они обычно лидят продукт) встречаю такой нарратив:
- мы тут опросили или узнали что в этой воронке вот столько шагов
- и все что пытаются сделать это повысить конверсию в каком-то шаге причем в лоб через фичи (новые кнопки, данные и так далее)

И вот на этом порочном круге придумай новую фишку проходят годы. Годами ваш продукт тормозит, но вы все еще придумываете новые фишки, кнопки, картинки чтобы увеличить конверсию. Все это тянется со знаменитой истории Марисы Майер (первый продакт менеджер Google или почти первый), которая перебрала 7000 оттенков синего, чтобы выбрать какой же все-таки цвет конвертит в выдаче в клик лучше. И вот далее эта логика есть «база» для каждого, кто строит свой проект.

Но многие забывают, что некоторые части достаточно просто ускорить. Например бронирования в booking.com случаются на 30% выше (цифры с потолка дискуссий с разными людьми, не придирайтесь) если сайт загружается менее чем за 300мс. И самый любимый мой пример это биддинг (аукцион за какую рекламу показать) на устройстве. В 16-17 году Facebook и другие DSP/SSP (реклама продают/поставляют) сделали так, что задержка на показ рекламы пользователю снизилась с 800мс до 200мс в среднем, что дало возможность показывать видео рекламу и более того загружать ее на устройство пользователя заранее (ведь мы торгуем за показ прям в приложении и не ждем сервера). Эта штука в первый год своего существования дала более 5 ярдов выручки (а маржа в рекламке 40% обычно) в первый год только в Facebook.

Это я к чему. Смотрите на ваши проблемы шире, думайте что действительно важно, а что нет. И что люди любят муки выбора и не надо их сокращать, можно сделать их доступнее или быстрее.

2,798

ChillHouse

04 Feb, 22:33

Ну вот же, вот же для рекламы надо делать ваш AI. Топ инструмент так то.
Будем пробовать «всего за косарь баксов в год» :)

2,809

ChillHouse

31 Jan, 16:00

Рекомендации в новый батч YC этой весной. Смотрим что там свежее. Ну все еще инфра и теперь уже агенты, которые будут прям полностью заменять людей на их рабочих местах, какой там co-pilot.

4,121

ChillHouse

30 Jan, 01:37

Немного карьерных твистов или как после купонов основать компанию по созданию сверхзвуковой авиации. И вся история в этом твите.

3,067

ChillHouse

29 Jan, 18:33

Для все еще интересующихся ценой обучения модели, CEO Anthropic выдал эссе с элементами политики (и тут AI напоминает гонку вооружений уже).

Из интересных моментов, которые он подчеркнул что модели которые рассуждают всегда основаны на базовой модели и ее качестве. То есть все эти рассуждения как бы следствие того, что у тебя получилось до этого в виде базы (база просто тренируется выдавать ответ на вопрос, такой очень умный автокомплит/заканчиватель предложения как я люблю говорить). Так же он сказал что их модель передовая была сделана примерно за несколько десятков миллионов (думаю 25-30).

Вообщем рекомендую к прочтению для понимания рынка AI. Так как эта технология будет везде, в любом бизнесе рано или поздно.

2,923

ChillHouse

27 Jan, 23:17

То что мертво, умереть не может. Это можно только продать и сделать новый холдинг LLVMH.

А так может слухи, но когда-то поднявший стартап французский под названием Mistral кажется находится в кризисе и думаю в каждой шутке доля шутки.

2,924

ChillHouse

27 Jan, 15:00

Хотел добавить важные пять копеек про вот этих ребят на первой строчке US AppStore. Это пока на моей памяти единственный пример где проведены абсолютно все оптимизации вертикально начиная с математики заканчивая железом. По сути архитектура решения в вычислительном дата центре подобрана под конкретную сетку и ее обучение. Добро пожаловать к ребятам из high frequency trading. Почитать внимательно можно тут.

Добавлю: для сравнения это как Apple в мире consumer устройств. По сути все начиная с железа, процессоров, софта, операционной системы сделано одной компанией. Я уверен китайцы держат такую же логику и как показывает практика это всегда самый сильный продукт.

3,427

ChillHouse

26 Jan, 13:10

Немного мыслей про агентские системы типа Operator от OpenAI и похожая штука есть у Claude. Типа даешь таск и оно управляет браузером (мышкой водит и клавиатурой пользуется). Так вот мои три копейки:

1/ Честно говоря это какие-то public эксперименты, в текущем виде это продукт без будущего и явно outdated. Андрей Карпаты написал в тви что похожую тему они задумали еще в 2016-17 до так сказать прогресса в трансформерах значимого. Зачем вообще эмулировать поведение браузера если можно пользовать API или там скрипты или еще что-то и сделать это без визуальной составляющей которая явно все дико замедляет. Это все отсылка к проекту MCP. Который сделает весь этот визуальный мусор ненужным.

2/ Все еще для меня особняком стоит старая продуктовая проблема голосовых ассистентов (кстати как пользуетесь часто?). Большая часть задач ставится голосом/текстом сложнее чем через обычный интерфейс протапать или прокликать. Одним словом формулировка уже вызывает сложности, не говоря о том, что по пути изменения могут происходить и голосом этим всем управлять тяжеловато. Попробуйте представить процесс заказа пиццы на дом (допустим система знает где дом, вы начинаете выбирать где заказать, выбирать пиццу, ой а надо же глянуть цену, а может даже фотку или состав, ну короче это мы еще не пришли к тому что если доставить нужно не к двери, а внизу или вот специальные инструкции как зайти во двор). Другими словами графический интерфейс сильно упрощает взаимодействие с информацией и ее представление. Как сделать взаимодействие быстрее я пока не знаю. Идея встроить куда-то там LLM очень даже ок, но на данный момент и работает все ужасно и доверия нет.

3/ ну и все же с релизом китайской сетки Deepseek r1 все начали паниковать мол смотрите она же open source и все про нее более менее понятно, кроме того сколько ресурсов влили в обучение реально (если верить китайцам то они получили тоже самое что OpenAI только за «5-50м баксов» что конечно очень дешево). Тем не менее пользоваться все еще этим добром тяжело, я нахожу фактические ошибки в каждом втором запросе если он посложнее инструкций. Или вот возможность сходить в интернет вызывает вопросы. Оставлю в комменте скрины интересно ваше мнение.

TLDR: следим за областью, но агенты в текущем виде это просто эксперименты рисерч лаб.

2,877

ChillHouse

24 Jan, 02:38

Наткнулся на компанию Deep Robotics из Китая, компании 8 лет и она единорог, делают роботов прям прикольных.

Стоит такой кажется 1600 баксов. Более того у них есть специальный open source проект для имитационного обучения. Кайф.

3,942

ChillHouse

22 Jan, 00:01

Небольшой новостной повод размером в 500 ярдов инвестиций (больше мне кажется, чем любые гос проекты до этого в истории США) в датацентры для AI. А пишут что даже для OpenAI, но четкой формулировки эксклюзивности нет (или я не нашел). Что конечно смахивает на гонку вооружений, но только в AI. В интересное время живем :)

А вообще часто избыток ресурсов и денег снижает темы инноваций и мотивацию что-то делать.

3,150

ChillHouse

21 Jan, 13:37

Есть короче такая мантра в индустрии про количество, которое якобы перетекает в «качество», ну результат.

Стандартная формулировка: вам нужно пропитчить вашу идею 200 раз и будет конверсия, или когда вот вы опросите 300 клиентов вы наконец поймете что к чему.

У меня абсолютно обратная логика. Чем больше вы фигачите в одном направлении и не чувствуете никакой отдачи кроме отказов без эмоций и прочего то нужно меняться и похоже кардинально. Во всех отказах есть свои причины. Понимание этих причин часто ведет к понимаю общих принципов работы той или иной индустрии.

И больше всего не понимаю, когда эти бесконечные отказы подают как мол «ты старайся, когда-то получится». Никакой связи нет. Надо уже привыкнуть, что без опыта (успешного) удача больший фактор чем настойчивость.

А вам что больше помогало настойчивость при большом количестве отказов или смена стратегии и новые попытки?

2,966

ChillHouse

21 Jan, 13:23

Достаточно показательные данные о том, сколько процентов нужно отдавать всяким адвайзерам и советникам в вашем стартапе.

Не более 1% человеку и всего обычно не более 2-3% так сказать на всей дистанции.

2,841

ChillHouse

19 Jan, 18:40

Так как тема выходного дня бан тиктока в сша, слежу прям интересно. Сделано конечно Трампом все круто, банят тикток, все молодежь не верит, приходит Трамп и говорит все будет ок, даже вординг внутри приложения поменяли.

Так голоса и зарабатывают. Четко.

Апдейт: ну все, работает :)

2,797

ChillHouse

19 Jan, 15:05

Там в сша тикток забанили и все что в целом от bytedance. И вот вам немного логики

Ну и update тут

2,663

ChillHouse

18 Jan, 13:07

Рубрика «прочитано, но не до конца понято».

1/ очень надоела тема агентов и их всемогущей силы, из каждого утюга. Даже нашел работу такую, которая мол говорит это не панацея. Еще работа антропика говорит, что агенты нужны очень мало где и классические алгоритмы по автоматизации очень даже неплохо справляются.

2/ понравилась статья по предсказанию трендов в AI. Просто занимательно и очень внятно написано.

3/ изучал какие у нас города дорогие для жизни, а какие нет, раньше не знал об этом сайте, а у вас есть такие интересные ресурсы поделитесь плиз

4/ узнал что такое инвектива

5/ пока ехал дочитал Князь Света Роберта Желязны, рекомендую любителям фантастики

6/ посмотрел два интервью, одно с Шале который очень крутой чувак в AI и запустил ARC Prize и моего любимого физика современности Роджера Пенроуза

7/ нашел свою первую лекцию в МФТИ еще 2016 года кажется

2,579

ChillHouse

18 Jan, 12:55

Друзья,

Каждый день провожу созвоны
Помогаю
Ваще только и делаю что инфобизнес для вас дорогих
Поэтому решил запустить для вас курс, закрытый клуб, платные консультации или просто мне нефиг делать, а денег нет и надо как-то зарабатывать, живу то где-то в какой-то стране, а тут все новое и так каждые пол года

Да нафиг не надо если есть основной бизнес или работа, которая нравится

2,373

ChillHouse

17 Jan, 09:10

Правда про венчуров. Хороший ответ и особенно сравнение с тем фактом, что если ты сидишь на первом ряду в играх топ команды это еще не значит, что получится ее тренировать.

Я так же поддерживаю идею, что лучшие партнеры в фондах это те кто сам строил компании.

2,593

ChillHouse

16 Jan, 13:10

“Информация из вторых рук всегда выглядит более стройно и убедительно, чем полные пробелов и неясностей сведения, которыми располагает ученый.”

Последнее время часто встречаю посты про какие-нибудь там процессы в компаниях (обычно это не корпорации, а либо стартапы либо небольшие компании около 100 человек). Я большой противник бюрократии на первых этапах развития и так же начальном этапе роста. Нашел для себя несколько первопричин почему же:

1/ любой новый процесс обычно это еще один шаг по модификации информации, будь то итоги встречи или еще одно письмо или комментарии где-то. Чем больше шагов тем более искажена начальная мысль, так же как в переписывании Библии в средние века.

2/ процессы это как вкусовщина каждому свое, самые жаркие споры и вечные о том как же нам вести задачи и какой фреймворк использовать, что редко двигает к результату, а скорее к личной привычке части людей использовать определенные инструменты. И да легче всего обсуждать именно еще один процесс ведь там у каждого будет мнение в отличие от хардовых вопросов (там где действительно существует влияние на результат например архитектура или дизайн)

3/ чем менее квалифицированная команда тем больше процессов в вашей компании и это логично. Так как хочется привести все к рельсам на которых нужно ехать и меньше думать, а думать это сложно. Все фреймворки обычно отсылают нас к заводам (канбан), фабрикам и прочему именно поэтому. По инструкции работать ума не надо.

4/ я не верю в то, что процесс поможет человеку стать лучшим профи, но поможет облегчить усилия на подумать это точно, поэтому процессы часто убивают креативность и идеи, так как по сути сводят все к повторению одного и того же

TLDR: как и наука tech это по сути индустрия умственного труда и автоматизация этого всегда будет уменьшать вероятность получения инноваций. При этом отрицать то, что организация работы нужна я не собираюсь.

2,404

ChillHouse

14 Jan, 19:31

Возвращаюсь из отпуска. Тут такое дело Nikita Bier запустил «новую» аппку. Explode. Суть та же, что и ранее только рассылка невидимой фигни идет через iMessage. Ранее он продал tbh в Facebook и GAS в Discord.

На что обратил внимание:
- инвайт в апп висит в activity даже если апп убит и живет он целый час аж
- после приглашения трех друзей, апп как бы должен заработать, но нет ты получаешь paywall с free trial на месяц - гениально скамово
- остальное все супер приятно и по максимум используются разные интеграции с фишками iOS

Запуск тестов дистрибуции был в августе где-то. Тюнили пол года.

Апп линк

Twitter анонс

2,988

ChillHouse

06 Jan, 13:10

Ахаха, ну это за 2000 USD надо было. Здоровому стартапу здоровая экономика.

3,645

ChillHouse

04 Jan, 15:42

Понравился видос с ответами CEO Nvidia о его лидершип команде топов, которых 60 человек (кек). И объяснение этому разумное. Главное сократить глубину иерархии и проводить меньше 1на1, чтобы не было привилегий к доступу к информации, что создает дисбаланс во власти и управлении. Да и на 60 человек и правда не сделаешь столько 1на1. И фидбек он дает при всех на общих встречах. Короткий видос.

Ну а вообще это все говорит лишь о том, что процессы и иерархия вторичны и главное чтобы был результат. А как к нему прийти дело уже частное.

3,782

ChillHouse

31 Dec, 18:41

Всех с наступающим! Ну и главное здоровья и чтобы следующий год был всегда лучше чем предыдущий!

3,842

ChillHouse

30 Dec, 16:39

“В науке существуют реальные знания и знания, создающие духовный комфорт;”
Глас Господа
Станислав Лем

Вот абсолютно тоже самое я считаю про курсы, советы, адвайзеров и прочую муть.
Я выявил некоторое количество достаточно абстрактных признаков «полезного взаимодействия» с курсом, книгой, человеком в профессиональном поле, которые ведут к повышению вероятности успеха в текущей деятельности.

1/ помощь требует времени, прямо как в терапии, вылечиться за раз не получится, так и понять как заработать миллион или научиться строить продажи на зарубежном рынке. И обычно времени нужно много (любые практики переносить тяжело учитывая разницу в майндсете и команде и текущем процессе).

2/ знания это боль и унижение особенно после 30. Потому что ни у кого нет желания учиться (обычно это эффект подмены а-ля если посмотрел короткий ролик с дофамином то мол если там информация интересная то поучился). Я в целом считаю что образование для взрослых работает только в определенных и достаточно узких кейсах. Поэтому учиться должно быть неприятно и сложно и мучительно. И даже моментами бесполезно на короткой дистанции.

3/ изучение кейсов других это просто набор кругозора и все. Ценность MBA в нетворке умных людей, ценность онлайн MBA мне не ясна. Более того многие кейсы настолько сильны привязаны к времени когда это происходило (люди, культура, исторический контекст, состояние рынка и сотни других факторов), что невольно понимаю что толку сейчас от этих знаний как он знаний быта средневековой деревни. Поэтому изучая чужой опыт старайтесь как можно быстрее ответить себе на вопрос могу ли я очень быстро применить это без серьезных изменений в процессах или продукте.

4/ доверяй, но проверяй! Спрашивай каких конкретно достижений в цифрах добился ваш коуч/адвайзер и прочие. БЕРИ РЕФЕРЕНСЫ на человека и ищи сам на рынке их (обычно сам коуч дает 2-3 человек).

5/ и наконец - отдыхай побольше, это самый эффективный улучшатель настроения, не хочешь - не делай. Работать с календарем 24/7 забитым бесполезными встречами нагружает мозг так, что не останется времени подумать, а без «подумать» вряд ли выйдет что-то адекватное.

3,716

ChillHouse

30 Dec, 13:04

Новогодний AMA, неделя была откисать по большей части, все-таки в Англии Рождество основной праздник поэтому и я решил отдохнуть. А так ловите опросник, чего было бы интересно или просто оставляйте пожелания 🙂

А кому хочется проверить насколько мощная о3 моделька от OpenAI можете поиграть в те самые задачки, на основе которых она "называется прорывом в причинно-следственных связях"

2,608

ChillHouse

23 Dec, 13:28

AI убьет «подставить название профессии» или очень популярный реддит пост про новую рекламу Coca Cola, которую сделали с помощью AI и маркетологи срубили себе годовой бонус

https://www.reddit.com/r/mildlyinfuriating/s/wcPdBrjuNN

3,595

ChillHouse

22 Dec, 01:28

Рубрика «прочитано, но не до конца понято»:

1/ Про нейронку, которая лежит в основе знаменитого шахматного бота stockfish. Фишка этой архитектуры в том что она старается очень мало менять внутренние состояния и вводные считая следующие ваши ходы. Уважаемая вещь.

2/ Боэций «Утешение философией». Книга вообщем то. Это для того, чтобы понять как мыслили в средневековье. Человек был настолько уважаемый, что его книгу переписывали почти во всех монастырях в Европе. Да и формат диалога в книге интересный. Хотите понять че там к чему было в головах у правителей, читайте смело.

3/ Достаточно старая статья на n+1 про некие уровни в физике, а-ля насколько все сложно и мем, который когда-то выложил Илон Маск. Одна из любимых статей, так как сам разбирался в теории струн (несколько лет, так для себя).

4/ Кажется откопал чисто случайно откуда взялся термин JTBD (job to be done). В шестидесятых некий Теодор Левитт, который работал в Гарварде как экономист и препод, выдал теорию под названием "маркетинговая близорукость". Если по-простому, он толкнул идею о том, что куча компаний тупят, определяя себя через свои продукты, а не через то, какие потребности они закрывают (сейчас эту тему и переупаковали в фреймворк "работа, которую нужно сделать").

5/ достаточно прикольный плейбук по монетизации от чувака из Eventbrite. Понравилось как просто и легко построены решения на основе базовых показателей таких как виральность, ретеншен и так далее.

6/ всем желающим разобраться в квантовых вычислениях рекомендую

3,399

ChillHouse

21 Dec, 17:08

Заметил такую штуку. Часто какой-нибудь head of ai ищет себе в команду senior product manager. Чтобы мол присоединиться к инновациям. Я читаю это так: короче есть тут пару идей, кто хочет таски в Jira писать, я буду диктовать на коллах?
Но обязательно опыт в ML/AI!

2,730

ChillHouse

20 Dec, 21:49

Мои пять копеек в мир великих AGI предсказателей и обожателей OpenAI.

Мне очень понравился сегодняшний релиз очень дорогого умного брутфорса. Или если хотите аналога alphaGO, но для определенного типа задач (затачивают под матан и логику кажется с геометрией). Чтобы лучше понимать откуда такая цена за прогон (решить по сути детскую задачку стоит 1500 баксов, но с математикой серьезного уровня там не все супер круто, 25% только по бенчу, стоит учесть что там очень серьезный бенчмарк и требует от человека крайне сильных знаний - меня максимум на одну с половиной задачу хватило), то лучшая аналогия это понять как работает та самая архитектура, которая всех выиграла в игру го. А там был внутри так называемый MCTS (monte Carlo tree search). И пару сеток который генерили ответы к позиции и дальше по ним шел такой умный поиск. Вот моя ставка что текущая версия o3 это оно и есть. Это какой-то умный алгоритм поиска плюс сеточка (скорее всего даже небольшая типа на 70B параметров). И вот ее тысячи прогонов в определенном окружении стоят столько.

Еще более простая аналогия это брутфорс, но не в лоб, а с подсказками. Как бы сетка подсказывает чего точно быть не может или что точно должно тут быть. Это сильно сокращает количество вариантов и поэтому процесс хотя бы сходится. Думаю, что будущее за сетками и еще несколькими внешними алгоритмами типа MCTS или Program Synthesis. Как ограничитель во времени используется идея test time compute.

Кстати один из авторов alphaGO Noam Brown перешел в OpenAI как раз где-то год назад, вот и результат.

Касательно AGI, черт знает что это конкретно, но типа прям разум и все такое, сам принимает новые решения доселе невероятные, то еще долговато. Но не так прям чтобы нереально. Лет 10-15.

3,308

ChillHouse

20 Dec, 18:24

https://arcprize.org/blog/oai-o3-pub-breakthrough

Ну что ж новая о3 модель подвозит очень крутые цепочки рассуждений и даже нормально решает бенчмарк тех кто сомневался. Да здравствует test time compute. Ждем релиза в начале след года. Или позже :)

Ах да забыл: один прогон может стоить пару косарей баксов

2,568

ChillHouse

17 Dec, 16:00

На картинке график популярности MidJourney. Это все про генерацию изображений и прочего графического. Относительный график, но важный. Он хорошо показывает насколько скорость и момент важны в цикле жизни продукта в интернете. Как легко можно стать лидером и так же легко потерять ветвь первенства.

Ни что так не важно как момент и тайминг когда вы делаете ваш продукт или стартап.

Конкретно у ребят получилось вырасти, использовать релевантные комьюнити инструменты, получить супер важные данные о предпочтениях чтобы быстро итерировать с моделью, НО так же отстать в производстве большого веб продукта, найма большего количества людей для более быстрых параллельных итераций в модели и продукте и проигрышу большим ребятам. Основатель тем не менее утверждает что проект не брал венчурное финансирование (что конечно можно прочитать как «деньги мы взяли, просто вот не у фондов или вам не скажем»).

2,936

ChillHouse

15 Dec, 18:57

Отечественные так сказать генераторы изображений. 😑

2,910

ChillHouse

15 Dec, 17:33

Минутка саморекламы кстати, а не рекламы обычной. Мы с Аней работали когда-то в mail ru еще на заре карьеры. Да и как-то вот периодически говорим на ее канале.

Помимо того, что ничего сверхъестественного я не говорю, мой контент часто приземленный. Но тем менее в воскресенье под фон может и зайдет.

Тык тык

2,909

ChillHouse

10 Dec, 23:43

Заметили, как все билдеры аппов на AI (ну все эти эксперты по промтам) типа гороскоп, коуч и прочее резко стали билдить агентов. Мол мы поможем вам создать то, что сами не смогли никому продать. Сделай своего агента, который будет эксель заполнять (кстати можно и без AI там формулки написать).

Так наблюдение.

4,753

ChillHouse

10 Dec, 15:32

Google там сделал прогресс в квантовых процессорах, и если половина чуваков вам просто постит заголовок, что мол смотрите штука считает то что классический комп считал бы дофига лет, то я вам всегда советую почитать Reddit или работу и понять, что задача для заголовка выбрана специально, чтобы квантовый проц решал ее быстро, а классический медленно.

А так прогресс ощутимый, еще лет 10 думаю до нормальных применений. Жду.

68,260

ChillHouse

09 Dec, 20:36

Иногда буду еще такие короткие факты постить а-ля TIL (today I learned).

Сегодня узнал где мы находимся на очень большом масштабе так сказать. Ланиакея с гавайского (и такой есть да) - необъятные небеса. Просто красивое название.

3,968

ChillHouse

09 Dec, 20:30

Что ищут большие фонды и YC. Небольшие саммари.

4,770

ChillHouse

06 Dec, 16:33

Одной строкой - вышла новая llama 3.3 70B метрики как у 3.2 405B. Meta норм так идет.

3,798

ChillHouse

04 Dec, 18:36

Короче, ваши ставки «новый Google» или еще один Theranos? Либо я чего-то не понимаю, но здесь что-то не так. А вы что думаете?

754

ChillHouse

02 Dec, 13:43

Вот так просто человек показал то, чем все занимаются часами в тиктоке и так далее. Жду новых продуктов, фичи которых можно будет вот так вот понять. Любому, без философии, просто понять и попробовать.

917

ChillHouse

02 Dec, 12:33

~~Яндекс~~ Nebius поднимает 700м ибо надо выходить в США. Но в целом мое ожидание, что это так себе ставка от ребят (по сути думаю кредит).

Могу пожелать удачи в конкуренции с AWS/Azure etc

993

ChillHouse

02 Dec, 00:44

Воскресное. Тематическое. В номинации лучший промт победил этот парень.

1,054

ChillHouse

30 Nov, 14:44

Думал короче вернусь в режим, но на неделе попал в больницу по абсолютной случайности. Короче жив здоров.

Дальше к делу. Тут такой тред про мотивацию инженеров в корпорациях у одного из моих любимых ныне инвесторов возник.

Позволю себе вольный перевод и свои пять копеек:

1/ есть некий миф или недопонимание мол инженеры (читай программисты) ленивые и вообще ничего не делают и не хотят. Что не совсем так. Скорее в современных корпорациях стимул выстроен в стиле завода 1950х.

2/ а именно нет никаких поощрений за упрощение или удаление ненужных частей кода/процесса. Если ты сделал что-то быстро - значит задача была легкая. Задачи в большинстве своем не вносят никаких существенных изменений в продукт, а лишь двигают KPI на пару процентных пунктов вперед. Помните все эти линкедины «увеличил конверсию на 1.5%», и даже если бизнес выиграл много, задача все равно скучная так как скорее всего вы пилите фреймворк для а/б тестов.

3/ не нравится текущая работа - смени и найди новую, грамотный инженер может себе позволить такое, а значит риск быть уволенным низкий. Инновации заключается в смене мидл менеджеров, которых вращают чтобы те не раскачивали лодку.

4/ почти все акции которые у тебя в опционе или бонусы которые зависят от KPI всей компании никак не связаны с твоим трудом. Твой код очень редко влияет на рост акций компании. Чувствуется что значимая часть твоего дохода (а иногда даже бОльшая часть) вообще к тебе никак не относится.

5/ ротация слабая, если люди слабые то никто их трогать не будет так как найм дороже содержания посредственных людей. Перед акционерами редко стоит обязательство увольнять кого-то, ну разве что ну совсем уже никак, но тогда просто удаляют чтобы финансы подтянуть, а не ситуацию с качеством исправить.

6/ все системы ревью полный треш. Система оценки взламывается через дружбу, делать только «важные» задачи и так далее. Закон Гудхарта. Любые метрики производительности можно взломать и это будут делать.

7/ все эти калибровки уравнивают все команды в один большой поток, где нет лучших и худших. Нет понижения выходит, а значит повышение в любом случае дает чувство безопасности.

Уверен что так почти везде где 10к плюс человек, а может и меньше. На моей практике даже поменьше компании обладают всеми этими чертами. Когда начинаешь измерять интеллектуальный труд получается что фиксить 2 бага в неделю эффективнее чем придумать новый продукт.

TLDR: Единственный способ существенно увеличить доход — получить повышение. Промо-пакеты и политика важнее, чем создание качественного продукта.

2,321

ChillHouse

25 Nov, 19:52

Возвращаемся к жизни после недели дня рожденья. Так вот интересно дела делаются и как мне кажется Антропик по чуть чуть делает для нашего любимого AI больше чем OpenAI, а именно начинают по чуть чуть внедрять стандарты и делать их открытыми (Open AI ахах), на этот раз протокол как скормить свой продукт агентам на основе LLM.

https://www.anthropic.com/news/model-context-protocol

1,698

ChillHouse

13 Nov, 17:51

Ну и касательно предыдущего тезиса.

Цитата: "Ilya Sutskever, co-founder of AI labs Safe Superintelligence (SSI) and OpenAI, told Reuters recently that results from scaling up pre-training - the phase of training an AI model that uses a vast amount of unlabeled data to understand language patterns and structures - have plateaued." Вообщем наконец-то начали признавать как обстоят дела. И думаю что Илья хорошо понимает что нужны другие методы и алгоритмы для следующего шага. Трансформеры в полной мере примерно показали себя.

2,127

ChillHouse

13 Nov, 02:27

Одна из самых как по мне значимых статей вышла. Она убедительно показывает, что мы достигаем пределов квантизации. В работе говорится: чем больше токенов используется для обучения, тем больше точности требуется. Или помните все эти битнеты(где всего веса из трех цифр 1 0 -1) и прочее (кажется это полное опровержение данной идеи).

Важно:
- почти всегда мы достигали лучшей производительности и прочего путем снижения размерности (пусть даже и циферок)
- другими словами замедление пришло и оно реально, похоже надо учиться улучшать то что есть уже и оптимизировать под более узкие кейсы

Всем интересующимся AI на серьезно обязательно читать

https://arxiv.org/pdf/2411.04330

2,034

ChillHouse

11 Nov, 21:25

До сих пор согласен, что юнит экономика это про далеко далеко, а команда и продукт про самое начало. Доказано путем общения с большим количеством разных фондов и decision makers.

P.S. наверное стоит упомянуть это именно про венчурные проекты (== требующие финансирования для быстрого роста и достижения результатов)

1,761

ChillHouse

11 Nov, 13:36

Не все может в курсе, но было время играл профессионально в футбол за тогда еще Смена, которая потом стала академией Зенита Санкт-Петербург. Поэтому переживаю на спорт и кажется там очень много проблем. Особенно в поиске талантов и процессу как игрок идет от молодежки к взрослому уровню. Кто смотрел такой сериал «вне игры»? Да я в целом верю что с помощью технологий можно значительно улучшить процесс в футбольных школах. Коррупции там тоже дофига.

Например, слежу за JuniStat - там ребята научили сеточки точно считать данные футболистов с помощью мобильника и собрали метрики с тысяч игроков от 8 до 18 лет по всему миру. Клубы и федерации используют эту систему, чтобы отслеживать данные перспективных игроков через тесты, валидированные по стандартам FIFA.

В мое время такие технологии были недоступны - сложно представить сколько детей могли бы показать себя и попасть на радары только по своим данным.
Ну и для тех кому не безразличен спорт и все такое вот канал CEO, и да это не реклама. Один из немногих проектов которые хочется поддержать, и я даже не инвестор @junistatsystem

1,688

ChillHouse

10 Nov, 20:55

Воскресное. Или о пользе онлайн игр.

Может быть вы слышали или нет, но я много играю в онлайн игры и помимо обычного соревновательного духа и всего такого есть одна вещь, которая мне очень импонирует.

А именно мы поговорим о социализации. Я в целом достаточно закрытый человек и к 33 годам у меня сугубо профессиональный круг общения и близкие. Это в целом ограничивает понимание что и как происходит у разных групп людей и населения. В онлайн играх же вы часто собираетесь в группу и идете вместе убивать боссов или играете команда на команду. Частенько вы сидите в голосовом чате типа Discord. И там как раз вы знакомитесь. И иногда крайне интересно слушать кто чем занимается (например у меня были проводники в поездах дальнего следования, работники нефтяной вышки и так далее) и это очень хорошо отрезвляет и дает хоть какое-то отличное от вашего пузыря виденье. Лично у меня не так много шансов регулярно слышать разные истории такого плана даже если я захочу. Такие дела.

А как вы выходите из вашего социального пузыря?

1,408

ChillHouse

10 Nov, 17:20

Ну наконец-то всем фанатам подкатили еще один солидный как по мне бенчмарк на этот раз по математике. И там прям никто не решает его и кстати разницы между o1 & gpt4o тоже нет.

Бесконечный хайп вокруг LLM думаю сильно стихнет, так как текущий прогресс просто банально зависит от разметки и данных о предпочтениях (один вариант лучше другого). Поэтому жду замедления высшей точки и быстрого роста небольших моделей по качеству. Так как их будут тренировать на качественных более данных.

1,493

ChillHouse

09 Nov, 01:52

У кого что там в ChatGPT по промту:

based on what you know about me. draw a picture of what you think my current life looks like

Присылайте свои результаты :) я видимо много спрашивал про wow, потому что так проверяю актуальность в поиске

1,460

ChillHouse

08 Nov, 13:17

Я когда-то сравнивал современный tech с промышленностью 30-40х годов 20 века. Ну вот же точно оно.

Идем на завод каждое утро да да

1,449

ChillHouse

06 Nov, 01:59

Раньше инвесторы писали: где у вас потенциал построить миллиардную компанию. Сейчас замечаю: где у вас тут триллионая компания.

Вот она инфляция.

1,735

ChillHouse

06 Nov, 00:15

Такая тут мысль вспомнилась из классического менеджемента. Может кто поначитанней сразу укажет мне, где такое написали уже.

Так вот в любых корпоративных ситуациях надо учитывать в своих решениях такой параметр как «конфликтоемкость». Это когда ваше решение ситуации затрагивает сразу много сущностей и людей то шанс получить столкновение лбами выше, поэтому всегда выбирайте путь минимального сопротивления участников, а значит наименьшего их количества.

По этой скромной теории да пойти к СЕО всегда самое безопасное решение и самое быстрое. Только часто туда не дойти :)

Так мысли вслух.

1,799

ChillHouse

02 Nov, 08:45

У Claude все больше и больше действительно удобных вещей выходит. Все-таки CPO из инсты влияет кажется.

2,183

ChillHouse

01 Nov, 02:22

Рубрика «прочитано, но может не до конца понято». Выпуск 2. С мобилы.

1/ Классическая работа по тому что есть AGI и как это можно понять.

2/ Я редко использую фреймворки в работе над продуктом. Но этот пожалуй лучшее что я знаю при работе с retention. Вообще самая идея, что под use case нужно подбирать метрики и делать паттерн мэтчинг по многим бенчам это кайф. Да и в целом статья отличная.

3/ я просто люблю читать квантамагазин. Не знаю почему. В этот раз про s матрицы вероятностей.

4/ многие уважаемые мною ученые верят что AGI или просто некст лвл моделька придет когда совместят deep learning и вот это

5/ какие-то мысли умного мужика про мол поиск и обучение будет всегда как методы

6/ старая статейка, но люблю возвращаться к тому как легко можно добавить в Гугле пару тройку ярдов прибыли

2,153

ChillHouse

31 Oct, 18:56

Кому как зашло? Делитесь фидбеком https://openai.com/index/introducing-chatgpt-search/

Я еще не успел попробовать

1,723

ChillHouse

31 Oct, 18:05

Удивительно, но ничего особо не поменялось. Значит рынок плюс минус за 5-6 лет на одном месте. Ну по adoption rate новых приложений и смены девайсов.

1,613

ChillHouse

31 Oct, 10:10

Набор курсов по использованию LLM от Anthropic. Рекомендую.

1,605

ChillHouse

28 Oct, 11:03

Украл. Ну это лучший кейс для AI.

2,498

ChillHouse

17 Oct, 14:45

И так ультимейт гайд по колдаутрич тактик, никаких плюсов в комментах чтобы собрать ваши контакты, подписок на вебинары и прочее.

Буду писать на примере письма инвестору. Думаю переложить сможете.

1/ заголовок - что вы делаете (we are doing commerce solution for gaming influencers) и если вы считаете вас узнают то плюс ваше имя и фамилия (занижайте степень уверенности что вас знают, людям шлют сотни писем в день и если вы не общаетесь лично раз в три месяца с друзьям друзей то вас не знают).

2/ начало это hi <name> дальше представиться (имя фамилия) и добавить трек рекорд из 5 слов: did Prisma, raised from, acquired by etc etc. Без подробностей.

3/ дальше показать что вы следите за чуваком или его работой. Read your twitter and appreciate efforts towards bla bla bla, saw your last deal in bla bla bla. Дальше сказать мол это прям уважуха и релевантно нам.

4/ что делаешь в двух предложениях . We are building ai for dog seaters, this is a special device that helps bla bla bla. Got 3k users, 500 MRR some numbers. We Believe in this 1T market. Ai will change it.

5/ что хочешь от человека. We started fundraising. Wonder if you are interested. Please lmk if you wanna chat.

И ноль ссылок. У меня конвертит лучше всего. Проходит любые фильтры, посылаю с личной почты. Предварительно стараюсь найти чувака в тви и там ему покомментить, но это опционально. Все письмо должно помещаться без скрола на экран телефона. Если есть фактура в виде крутых цифр и результатов всегда вставляйте в блок что делаем, если подробности просьбы есть добавьте максимум одно предложение.

Лучший ответ это краткое да «свяжу с командой, когда созвонимся итд», краткое «нет, не интересно». Никаких между.

👍

2,533

ChillHouse

17 Oct, 13:21

Подождите, а все успешные предприниматели и стартаперы обязательно начинают продавать свои курсы или там вебинары? Вроде же либо денег много либо работы много, а когда есть время на курсы значит чего-то не сходится.

1,866

ChillHouse

17 Oct, 11:48

Одной строкой мои дорогим подписочным бизнесам: FTC через 6 месяцев или около того обяжет в один клик давать отписаться без кучи подтвреждений и вообще все идет к тому, чтобы подписаться и отписаться должно быть одинаково легко. Ну наконец-то всем этим скамерам конец, жду несколько лет.

1,718

ChillHouse

16 Oct, 18:23

Так как мой канал по чуть растет и в первую благодаря дальнейшим коллабам с папками. В этот раз папка ребят от сообщества r founders. Тут в основном про опыт конкретных людей, поэтому посмотрите возможно кто-то зайдет.

Sneak peak:

- Миша Ляпин интересно про Африку, вообще никогда ничего не делал для этого региона и там особенно четко видна культурная динамика
- proventure это классика от Дениса Ефремова, который давно уже занимается инвестициями
- а вообще советую job board :)

Отдельное спасибо лиду сообщества Екатерине Курашевой (кстати тоже есть канал кому интересно).

Мне кажется формат обмена аудиторией работает до определенного масштаба. Мы делали много сообществ в дискорде и сейчас в телеге. И кажется что у каждого сообщества пока оно узкое по тематике есть предел. А дальше в общие топики скатывается: а-ля как заработать или как не уйти в депрессию. Что конечно слишком general для меня лично.

У кого есть свой канал? Кто хочет коллабу?

P.S. Не знаю как у вас. Я трачу на канал 5-7 минут в день, иногда меньше. Просто потому что продолжаю писать что думаю. Наверное это и не дает расти быстрее.

1,720

ChillHouse

16 Oct, 00:19

Так как тут в целом поднимался топик небольших команд, а это для меня аналог стартапа или режима стартапа в корпорации.

А я вроде как делал такие команды и не раз. Напишу несколько важных признаков.

1/ Вы ищите того, кто разделяет вашу идею. Или это называется product obsession. Это редко фича, это обычно определенный вектор развития области. Например в consumer это может быть геймификация или мессаджинг. Вы ищите того, кто хочет заниматься определенной областью. И не ищите того, кто хочет делать конкретную фичу, так как мы все знаем что чаще всего базовая идея претерпевает огромные изменения (пивоты), но при этом часто оставаясь в той же области (поэтому переход от б2с к б2б так больно ощущается ибо нужны совсем другие люди).
2/ Вы ищите групповую динамику. Одним словом все участники вашей команды в равной (ну хотя бы не нулевой) степени взаимодействуют с друг другом. Это важно каждому видеть, что его коллега тоже старается и вносит свой вклад пусть и не всегда ценный, но важно стремление. Поэтому важно создание атмосферы, где каждый чувствует движение и вы все вместе вкладываете в него.
3/ Вы ищите потенциал роста, а не потенциал реализации знаний. Идеальная команда та, которой есть куда хардскилово расти (а не только софт скилами). Поэтому бывает крайне сложно сделать что-то рабочее и быстро с командой у которой опыт по 20+ лет. Они не понимают куда расти в навыках и соотв как их развивать.
4/ Вы ищите максимальный навык self management. Потому что процессы убивают небольшие команды.
5/ Ну и наконец, что часто забывают вы ищите честность. Если кому-то вдруг стало это все не надо - говорить и только говорить. Поэтому договариваетесь сразу на берегу что если задолбало то расскажите это. Решение всегда есть.

Gather High performance team это наверное самый важный навык для CEO или менеджера, который хочет добиться результата.

Тема большая и конечно выше не все признаки и есть много чего еще специфичного к области. Пожалуй как сформулирую напишу.

P.S. Вы наверное заметили, что в канале у меня ни форматирования и ошибки и опечатки часто. Все, потому что посты пишу на живую и без подготовки. Этот пост написан за 3 минуты чистого времени. Просто мыль созрела.

1,575

ChillHouse

15 Oct, 17:41

Запомните best price guaranteed :)
500k за сервачок для обучения ваших моделей

1,368

ChillHouse

15 Oct, 15:22

Решил запостить странную рубрику "прочитано, но может не до конца понято за эту неделю" с коротким описанием че к чему. Может кому полезным будет.

1/ Задача коллекционера или сколько нужно покупок чтобы собрать коллекцию n бегемотов из киндера. Аналогов задачи много.
2/ Иногда нахожу забытую вкладку с объяснением рейтинговых систем в онлайн играх и прочем. Но всегда лень читать. Может вам пригодится, можно опустить математику и просто понять что все не так просто и подкрутка в матчмейкинге "бред".
3/ Еще одна вкладка, которая постоянно висит это оригинальный пэйпер основателей Google. Просто забавно видеть это находясь сегодня тут. И тут считаю важным добавить фразу в рассказе про ранний Google одного из первых инженеров Jeff Dean "Small teams can create systems used by hundreds of millions" ну и его презентацию на 10летие Google
4/ Всегда читаю Stratchery.
5/ Показали прикольный кейс диктовки с AI
6/ Говорят можно поверить в second order optimizers

Если такой рандом был полезен, ставим плюсики сердечки буду почаще делиться открытыми вкладками.

1,548

ChillHouse

15 Oct, 08:40

Assuming the company is roughly split between Starship, Starlink and F9/Dragon/etc.

Но вообще, я еще работая в Яндексе не понимал зачем тысячи людей чтобы делать поиск. Потом на какое-то время понял, потом снова потерял нить смысла.

И да, считаю, что огромные компании с тоннами клиентов и миллионами пользователей можно делать намного более меньшим количеством людей.

1,375

ChillHouse

12 Oct, 23:12

В контраст такой позиции, ну практически. Я считаю лучшая работа в направлении «powerful AI» и вообще что это такое это вот

Так же советую подписаться на него (автора этой работы) в тви

1,523

ChillHouse

12 Oct, 16:46

Ну и еще OpenAI показали экспериментальную либу для оркестрации агентов и их сборки ну и так далее. Кто пробовал? Дайте знать как вам :)

1,640

ChillHouse

12 Oct, 16:19

Подкину вам почитать эссе СЕО Anthropic на выходные. Большое эссе. В основном про что нам даст AGI, он называет его powerful AI. Про разные области где наиболее эффект будет заметно (ничего в целом удивительного), ну и еще он крайне оптимистичен что такой AI (одна модель, много или комбо кучи всего возможно с новой архитектурой) появится в 2026 (видимо надо денег поднять еще).

1,603

ChillHouse

08 Oct, 12:59

Совет дня от Тоби Лютке (крайне уважаю СЕО Shopify за культуру которую он транслирует): периодически надо сносить все регулярные встречи, чтобы компания была более здоровой. Тогда для новых нужно заново будет придумать обоснование и причины. Это помогает больше сосредоточиться на работе.

Я пожалуй страдаю одним командным викли, который иногда отменяю. Но все эти регулярные 1на1 и прочее чисто проклятье как по мне.

1,710

ChillHouse

08 Oct, 11:16

Тем временем Нобелевка по физике (почему по ней - ума не приложу) присуждается соврменным основоположникам нейросетей в computer science - Хинтону и Хопфилду. Рекурентные сети и backpropogation. Немного удвилен, но видимо в хайп даже нобелевка уже вписывается.

1,494

ChillHouse

06 Oct, 13:58

По воскресеньям помимо тупого фарма в играх часто выбираю что-то почитать. Сегодня дотягиваю то, что забылось в ML. А самый лучший вариант на русском языке имхо вот

1,608

ChillHouse

06 Oct, 08:10

До сих пор убедительно считаю, что продакт менеджеры в стартапе не нужны.
До сих пор считаю, что основатели должны выполнять роль руководителя продукта, так как владеют стратегией и бюджетом (если смогли поднять или заработать).
До сих пор считаю, что функция продакт менеджера появляется и становится ценной, когда компании нужны оптимизации в уже понятном направлении (готовый бизнес, рост продукта, есть PMF).
До сих пор считаю, что владельцем продукта может быть разработчик, дизайнер, тестировщик да кто угодно, лишь бы смог или смогла доказать что это надо делать и довести до результатов.

И при всем этом продолжаю слышать как воспевают оды профессии product manager.

1,581

ChillHouse

03 Oct, 00:04

Иногда вступаю в разные диалоги в твиттере. В этот раз оказался с GP A16Z Martin Casado.

Он запостил крайне интересное мнение, которое мне очень близко и к которому я на уровне интуиции склоняюсь, но не могу объяснить почему так.

Держится все на следующей гипотезе. Существует два типа проблем, решаемых с помощью AI: проблемы с мягкими границами принятия решений (soft-decision boundary problems) и проблемы с жесткими границами принятия решений (hard-decision boundary problems). В проблемах с мягкими границами (всякие ассистенты, генерация изображений/эффектов итд) можно допускать небольшие ошибки без влияния на результат. Проблемы с жесткими границами (agents) - это те, где даже одна ошибка повлияет на успех результата. Агент принимает последовательность решений и выполняет действия для достижения результата. Один неверный шаг ведет к неудаче. Вот почему они "эмпирически" воспринимаются как ненадежные. И как соответствие к ним возникает много вопросов.

Решение же данной неувязки лежит в том, что решение проверяется (либо другим более умным агентом либо через верификацию фактом или поиском) и если не подошло, то делаем еще 100500 разных запросов по тому же шагу. И пока не попадем в цель. Что для меня в принципе противоречит идеи LLM как сжатому представлению данных с определенной вероятностной структурой.

TLDR: зачем пытаться устранить вероятности если они зашиты в саму суть технологии. Пока не понял. И кажется что для проблем с мягкой границей LLM прекрасный инструмент, а там где цена ошибки велика - не очень.

1,785

ChillHouse

02 Oct, 20:39

И еще раз double down ставка от инвесторов. Лично мне кажется, что высок риск появления новой архитектуры которая сотрет их успех и сделает доступным качество как у ребят для каждого. Но время покажет. Пока изучаю вопрос.

Как вы думаете победит ли OpenAI или ждем нового витка компаний?

1,454

ChillHouse

01 Oct, 19:23

И снова за то, чтобы появились свои аналоги, наверное, да?

1. Прогресс неостановим
2. Работать все равно ничего не будет
(С)

1,413

ChillHouse

ChillHouse (English)

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse

ChillHouse