Вчера практически все инфо-пространство было забито «болью» переоцененных технологических компаний США, вкладывающих сотни миллиардов долларов в ИИ, но тут внезапно появляется китайская выскочка и в условиях ограниченных ресурсов создает нечто, что способно эффективно конкурировать с передовыми американскими LLMs.
Недоброжелатели создают предположения, что DeepSeek не более, чем глубоко зафайнтюненная реплика американских LLMs, часть из которых с открытом кодом типа Llama, мимикрирующая под улучшенный клон ChatGPT.
Если это не так, а дело в гениальных алгоритмах и математических моделях – соответственно, полностью меняется подход к созданию и развитию дорогостоящей ИИ инфраструктуры. Если успех DeepSeek подтвердится и будет доказано, что их подход не основан на повторном использовании существующих технологий, это может привести к переосмыслению стратегий разработки ИИ во всем мире.
Все это фактически означает кристаллизацию тезиса о том, что американцы – «идиоты», вкладывающие сотни миллиардов долларов в бесконечные «плантации» центров обработки данных, сжирающих гигаватты электроэнергии, тогда как хитрые китайцы – гении, создавшие чудо при меньших ресурсах в сотни или даже тысячи раз. Зачем платить так много, когда можно «поиграться» с архитектурой и алгоритмами и кратно сократить расходы.
Недавно Сэм Альтман критично высказался относительно китайцев, суть тезиса свелась к тому, что «американские компании находятся на передовом крае разработки LLMs, что означает необходимость инвестиций в фундаментальные исследования и эксперименты. Китайские компании могут использовать уже наработанный американцами фундамент и фокусироваться на оптимизации и адаптации существующих моделей.» Типа сложно создать что-то новое, но условно легко скопировать работающую технологию.
Альтмана можно понять – компания в чудовищных убытках без перспектив выхода в прибыль, растет давление ключевых инвесторов, а откатить назад и сбавить темп не получится, - слишком масштабно начали и слишком велика ответственность за провал. Но чем дальше – тем выше дыра в бюджете, а нужно чем-то крыть.
Нужно как то оправдывать многомиллиардные инвестиции (это относится ко всем бигтехам), а давление китайцев однозначно создаст нервозную обстановку, увеличивая количество ошибок, как тактических, так и стратегических.
Как гипотеза:
● Американский путь: фокус на масштабе, универсальности, широком коммерческом применении, большие инвестиции в инфраструктуру. Сильные стороны: мощные, универсальные модели, широкий спектр возможностей. Слабые стороны: высокая стоимость, энергопотребление, потенциальная избыточность для некоторых задач.
● Китайский путь (DeepSeek как пример): фокус на эффективности, специализации, возможно, более ориентирован на внутренний рынок и государственные нужды, оптимизация алгоритмов и использование существующих наработок. Сильные стороны: экономичность, эффективность при ограниченных ресурсах, потенциал для создания специализированных решений. Слабые стороны: возможно, меньшая универсальность, зависимость от открытых разработок.
Я не знаю глубины гибкости и потенциала развития китайских LLMs, да я думаю никто не знает, кроме ограниченного круга лиц в Китае.
Так начал ли коллапсировать пузырь? При всех исключительных преимуществах ГИИ, нет никакой реалистичной возможности окупить подобный масштаб и темп накопления инвестиций и расходов в LLM, нет там отдачи в триллионы долларов.
Я на протяжении всего 2024 года подробно развивал этот тезис и подтверждаю его сейчас, несмотря на оптимистичные взгляды и ожидания относительно развития LLMs.
Учитывая, насколько безумные мультипликаторы, предполагающие отдачу буквально в триллионы долларов, коллапс пузыря неизбежен. DeepSeek это лишь триггер, почва под слом ожиданий была подготовлена ранее через гиперконцентрацию ресурсов в бигтехах и раздутые мультипликаторы.
Все это не отменяет того, что технология продолжит бурное развитие и внедрение, но не по такой цене (в 15-20 триллионов долларов).