Незадолго до ТГЕ ко-фаундер Grass ответил на вопросы по проекту:
Одной из самых серьезных проблем в обучении моделей искусственного интеллекта на сегодняшний день является тот объем информации, что эти модели уже сосканировали всю нужную информацию из интернета. Как здесь может быть полезен Grass?
Реальность такова, что у данных короткий период актуальности. В современных условиях производительность большинства языковых моделей сравнялась, потому что все они были обучены на одних и тех же массивных статических наборах данных. Это предел, которого мы достигли; без новых знаний эти модели не могут дифференцироваться или развиваться дальше.
Что будет отличать эти модели в долгосрочной перспективе, так это их способность извлекать новую информацию по мере ее поступления в Интернет в режиме реального времени. В мире есть только две компании, к которым AI labs могут обратиться за подключением своих моделей к Интернету, что и делает Grass's Live Context Retrieval (LCR). Проблема этих двух существующих решений в том, что они искажены SEO и монетизацией на основе рекламы. Эти системы созданы не для того, чтобы модели искусственного интеллекта извлекали релевантную информацию - они созданы для оптимизации кликов пользователя.
Что сегодня преобладает в ИИ?
Что преобладает в ИИ сегодня, так это подход "грубой силы" для обучения массивных моделей. В последние несколько лет наблюдается тенденция к слепому масштабированию входных данных, предполагающая, что большее количество параметров и данных автоматически приведет к лучшим результатам.
Все последние исследования в области ML указывают на оптимизацию алгоритмов обучения, а не на слепое масштабирование входных данных. Интересно то, что мы только начинаем понимать, что возможно, когда мы фокусируемся на эффективности, а не на законах масштабирования.
Компания Grass может извлечь выгоду из этого сдвига в развитии искусственного интеллекта»
https://x.com/0xdrej/status/1847350899686916455