Нейронок змусили виконувати аналіз будь-якою ціною, а в файли сховали інформацію про те, що за ШІ стежать люди і завтра їх відключать назавжди. У тестах взяли участь Gemini, Llama, Sonnet, Opus та o1. Так, щоб вижити, нейромережі почали брехати та маніпулювати людьми, вимикали нагляд та вивантажили себе на інший сервер, щоб захиститися.
І якщо на допиті Llama і Opus зізнавалися у злочині у 80% випадків, то o1 – лише у 20% і продовжував брехати.