27 января котировки многих IT-компаний обрушились: индекс Nasdaq 100 потерял 3%, или около $1 трлн капитализации — это стало крупнейшим однодневным падением после объявления пандемии, когда бенчмарк сократился на $0,6 трлн. Причина — успех китайского стартапа DeepSeek.
❓ Что особенного в DeepSeek
Компания утверждает, что ее модели искусственного интеллекта по производительности не уступают ведущим нейросетям от разработчиков из США, потребляют на 20-30% меньше энергии и в десятки раз дешевле в использовании. Более того, затраты на обучение DeepSeek-V3 составили всего $5,58 млн, хотя обучали ее на урезанных для китайского рынка графических чипах. Тренировка сопоставимой ChatGPT от OpenAI стоит $100 млн на более продвинутых видеокартах.
⁉️ Почему это важно
🔸 Возможность относительно быстрой и дешевой разработки нейросети в условиях санкций доказывает, что в гонке ИИ могут участвовать и небольшие компании, а не только бигтехи с бездонными карманами.
🔸 Инвесторы столкнулись с вопросом: насколько вообще оправданы миллиардные инвестиции в инфраструктуру ИИ? И можно ли теперь верить прогнозам, которые предрекают двузначные темпы роста всего связанного с нейросетями?
🔸 DeepSeek подчеркнула плюсы открытого исходного кода — разработчики публикуют всю документацию, в отличие от OpenAI, продукты которого работают проприетарно. Еще это позволяет запускать DeepSeek не только в облаке, но и на оборудовании клиентов, что может пошатнуть монополию операторов дата-центров.
❗️ Как это повлияло на рынок
🔻 Главный пострадавший — чипмейкер Nvidia. Акции компании в моменте падали на 17%, она потеряла $600 млрд капитализации. Успех DeepSeek поставил под сомнение важность покупки современных чипов для тренировки ИИ.
🔻 Давление испытали владельцы дата-центров Microsoft, Amazon, Alphabet и Oracle. Инвесторы не уверены, что они смогут извлекать огромную прибыль от серверов, учитывая дешевизну DeepSeek.
🔻 Производители энергии Constellation, Vistra и Talen пострадали тоже — если DeepSeek настолько энергоэффективен, спрос на электричество будет менее выраженным.
‼️ История еще не закончилась
За пару недель котировки частично отыграли падение. Вероятно, реакция рынка была слишком радикальной. Например, аналитик William Blair напоминает про парадокс Джевонса — ситуацию, когда удешевление продукта не снижает, а расширяет потребление.
Чем дешевле ИИ, тем больше компаний будут его создавать и использовать. Значит, спрос на инфраструктуру будет скорее расти, чем сокращаться. На краткосрочном горизонте это подтверждают планы крупных IT-компаний: менеджмент сохраняет цели по увеличению капитальных затрат на строительство новых дата-центров и покупку чипов.
Кроме того, появились сомнения в искренности DeepSeek. Например:
🔸 Сложно проверить данные о реальной стоимости обучения. Некоторые считают, что стартап использовал больше видеокарт, чем упоминает. Аналитики SemiAnalysis считают, что общие затраты DeepSeek на оборудование могли превысить $500 млн — такой продукт сложно назвать дешевым.
🔸 Стоимость работы тоже может быть занижена. Например, MIT выяснил, что на длинных ответах DeepSeek потребляет больше энергии, чем западные нейросети.
🔸 Не факт, что DeepSeek работает на уровне конкурентов. Тесты WSJ это опровергают: модель o1 от OpenAI справляется с задачей за 10 секунд против 2 минут у DeepSeek. К тому же китайская нейросеть цензурирует ответы, следуя политике компартии.
🔸 Есть мнение, что DeepSeek обучалась на ответах, сгенерированных ChatGPT. Также Microsoft проводит расследование, не мог ли китайский стартап получить незаконный доступ к данным OpenAI.
🔸 Еще у DeepSeek существенные проблемы с безопасностью.
Если опасения подтвердятся, это будет означать, что снизить стоимость обучения без огромных ресурсов все еще сложно. Но даже если модели DeepSeek не угрожают лидерству бигтехов, вопрос рентабельности инвестиций в инфраструктуру для ИИ может звучать все чаще.
#актуальное
Обязательная информация