Лауреатами премии по химии стали Дэвид Бейкер, разработавший методы прогнозирования трехмерных структур белков, и сотрудники компании DeepMind Демис Хассабис и Джон Джампер, использовавшие его изобретение на практике. В 2020 г. Хассабис и Джампер запустили проект по определению структуры белков с помощью ИИ, названного AlphaFold. Обычно для получения точных данных о строении белков используются сложные и дорогостоящие методы, такие как рентгеновская кристаллография, ЯМР-спектроскопия и криоэлектронная микроскопия. Таким образом были получены сведения о структуре примерно 226 тыс. белков, размещенные в международной базе данных Protein Data Bank. Разработчики AlphaFold воспользовались ей, обучив на этой информации нейросеть, которая по аналогии могла прогнозировать структуру белков, для которых еще не было получено экспериментальных данных. Всего за 4 года модель смогла предсказать структуру более 1 млн белков, что должно было сократить затраты на исследования и помочь с разработкой препаратов благодаря сведениям о новых белках.
Авторы проекта обещали "точность на уровне атомов", конкурирующую с экспериментальными данными и даже превосходящую их (поскольку они не всегда имеют структуру, расшифрованную на 100%).
Но все оказалось не так просто. AlphaFold не стала счастливым исключением среди ИИ, продемонстрировав низкую точность, которая противоречит обещаниям разработчиков способствовать созданию новых препаратов. В ноябре 2023 г. в Nature вышла статья исследовательской группы, которая сопоставила предсказания AlphaFold с экспериментальными данными. Оказалось, что даже наиболее высококачественные прогнозы AlphaFold дают в 2 раза больше ошибок, чем экспериментально определенные структуры. 10% прогнозов с самым высоким уровнем достоверности имеют очень существенные ошибки. Так происходит потому, что AlphaFold не учитывает наличие лигандов (молекул, которые связываются с белком и влияют на его структуру), ионов, ковалентных модификаций и условия окружающей среды.
Хотя в мае 2024 г. была представлена новая версия AlphaFold 3, исправившая часть ошибок (например, в ней учитывались взаимодействия белка с лигандами, ДНК, РНК и другими молекулами), ее точность все еще далека от идеальной. Она варьируется от 40% до 80%, при этом для отдельных взаимодействий, например, с РНК, она была особенно низкой. Кроме того, никуда не делись галлюцинации (правдоподобные, но не существующие в реальности структуры), характерные для AlphaFold также, как и для обычных генеративных ИИ. Кроме того, хотя разработчики утверждали, что результаты их модели по крайней мере на 50% превосходят другие прогностические ИИ в этой сфере, в дальнейшем это было опровергнуто. Например, AlphaFold лучше всего работает с 50 наиболее распространенными лигандами, но в случае с менее распространенными его результаты заметно ниже. В одном из случаев его сравнили с другой схожей моделью Vina, которая оказалась на 8,2% эффективнее за пределами набора самых распространенных лигандов, чем AlphaFold.
Так что, несмотря на все перспективы метода, который будет совершенствоваться в дальнейшем, Нобелевская премия, врученная за его создание, пока еще слишком преждевременна.