Китайский стартап DeepSeek на днях произвел революцию. Он выкатил инновационную модель ИИ, способную задвинуть гиганта OpenAI. ChatGPT в AppStore он уже обогнал.
🃏 Козырной туз DeepSeek — цена. Его модель в 14 раз дешевле GPT-4 и обучалась на графических процессорах Nvidia H800 всего 2 месяца. Такую немыслимую эффективность китайской модели подарили уникальные архитектуры Multi-token Prediction (MTP) и Mixture of Experts (MoE).
Пока OpenAI ставит на сложные и дорогие системы с миллиардами параметров, DeepSeek использует минимум вычислительных ресурсов без ущерба производительности.
Пока чат GPT-4 активирует 1,8 трлн параметров одновременно, DeepSeek применяет другую стратегию, где затраты на обучение снижены до 90%. И что самое печальное для конкурентов, его производительность при этом не хуже.
А еще у DeepSeek открытый исходный код. Теперь любой студент может замутить стартап и разработать собственные решения, не тратя миллионы на обучение:
Что и говорить, гиганты в панике. Трамп тут недавно собрался инвестировать полтриллиона долларов в ИИ. Но надо ли «затапливать» деньгами такие компании, если все то же самое можно сделать намного дешевле?
Евген – не эксперт в ИИ, просто любопытствующий. Но по его мнению, китайская модель хорошо работает, однако до ChatGPT ей еще, как от Москвы до Пекина пешком: не хватает многих фишек. Хотя для Госуслуг это более чем достаточно.
Возможно, их докрутят, но ведь и американцы сейчас могут взять на вооружение новый подход DeepSeek к вычислениям, снова завоевав лидерство в этой сфере.
Играющий с щенком Евген
@InvestFuture