OpenAI анонсировала GPT-4.5, и после изучения всех материалов возникает странное ощущение дежавю. То, что преподносится как "крупнейшая и лучшая модель для чата", на деле выглядит больше как небольшое обновление, а не “прорыв”.
Судя по представленным данным, GPT-4.5 — это просто масштабирование уже известного подхода без принципиальных архитектурных изменений. Да, модель получила больше данных, больше вычислительной мощности и, как результат, немного улучшила свои характеристики. Она меньше галлюцинирует (37.1% против 61.8% у GPT-4o), лучше понимает намерения пользователя и демонстрирует более высокий "эмоциональный интеллект".
Пожалуй, самое заметное улучшение — более естественное общение. GPT-4.5 действительно стала более лаконичной и разговорчивой, без канцелярских оборотов и ненужных структурированных списков. В примерах видно, что она дает более теплые и интуитивные ответы, лучше считывает эмоциональный подтекст и не перегружает информацией там, где нужна просто поддержка. Но если честно, это можно сделать и на более старых чат-ботах написав соответствующий промт.
Но что действительно бросается в глаза — GPT-4.5 не умеет "думать" перед ответом, в отличие от моделей серии "o". Судя по таблице сравнения, на сложных математических задачах AIME '24 она набирает всего 36.7%, тогда как o3-mini достигает потрясающих 87.3%.
Странно видеть, как OpenAI выпускает такое промежуточное решение, особенно учитывая, что Сэм Альтман уже анонсировал серьезную реструктуризацию подхода к моделям. GPT-5, которая ожидается через несколько месяцев, обещает стать действительно революционной системой.
В отличие от 4.5, пятая версия будет построена на принципиально новой архитектуре, интегрирующей технологию o3 и другие передовые разработки. Она сможет самостоятельно определять необходимый уровень вычислительной мощности для каждой задачи, объединит голосовое управление, работу с изображениями и поисковые возможности в единую систему.
Учитывая все это, GPT-4.5 выглядит как своеобразный "филлер" — нечто, призванное занять пользователей в ожидании настоящего технологического прорыва. Впрочем, даже такое промежуточное решение все равно опережает многих конкурентов. Модель пока доступна подписчикам Pro (которая 200 долларов в месяц), но скоро раскатают и на всех остальных.
@droidergram