Тема развития AGI не раз становилась предметом интереса ИТ-сообщества. Концепция, где машины могут выполнять любую интеллектуальную задачу, обладая способностью учиться, рассуждать и адаптироваться автономно, привлекла и крупные компании, как OpenAI, которые даже давали намеки на то, что будут работать в этом направлении.
🚀 Экспериментальная модель O3 от OpenAI набрала 87,5% баллов в тесте ARC. Это превосходит предыдущий результат на 55,5% и было оценено экспертами как прорыв в области логического мышления.
OpenAI не раскрывает конкретные принципы работы O3, но эксперты предполагают, что возможности рассуждений моделей основаны на четырех принципах:
💡Policy initialization: предварительное обучение и тонкая настройка модели оснащают ее рассуждениями, подобными человеческим.
💡Reward Design: система оценивает как конечные результаты, так и промежуточные шаги, направляя модель к эффективным стратегиям решения.
💡Search: позволяет модели исследовать несколько путей для достижения оптимальных результатов.
💡Learning: позволяет совершенствоваться путем проб и ошибок, достигая сверхчеловеческой производительности в определенных областях.
Если кратко: в отличие от традиционных систем ИИ, которые полагаются на статические ответы, эти модели используют динамический подход, разбивая проблемы, анализируя задачи, выполняя самостоятельную оценку и исправляя ошибки.
Однако не доверяют тестам. Критики утверждают, что во многих из них моделями ИИ используются упрощенные методы обучения. Продолжается разработка более надежных тестов, как Google-Proof Q&A и MMMU, для моделирования реальных условий.
💭 На мой взгляд, путь к AGI требует перехода от показателей, ориентированных исключительно на производительность, к более широким, как устойчивость и адаптивность. На сегодняшний день ни одна система не достигла настоящего уровня AGI, им не хватает ресурсов для работы в непредсказуемых сценариях реального мира без предварительной настройки. Однако достижения в области LLM и мультимодальных систем приближают нас к пониманию того, как может выглядеть AGI.
#СверхРазум