Несов на LessWrong предложил новый способ загрузки сознания, основанный на контрфактуалах и теории принятия решений:
"Существуют агенты/люди, которые не имеют конкретных экземпляров в мире, и мы можем спросить, что они испытывают. Они могут покидать физический мир и возвращаться в него, воплощаясь заново или впервые. Они могут постоянно существовать вне конкретного воплощения в мире, взаимодействуя с ним только через рассуждения об их поведении, что может быть более эффективным способом реализации личности, чем простая конкретная загрузка сознания." https://www.lesswrong.com/posts/SEDboPNjcSD7epJ7A/the-quantum-mars-teleporter-an-empirical-test-of-personal?commentId=v6Tyfc8pfFgBAnAtH
Простое объяснение:
Представь, что есть два способа создать цифровую копию человека:
1. Обычный способ: делаем точную копию мозга человека в компьютере, как фотографию. Это требует много ресурсов компьютера.
2. Новый способ, который предложил Несов: вместо полной копии, мы просто записываем:
- Чего хочет этот человек (его главные цели)
- Как он обычно принимает решения
- На какое время вперед он планирует
- Какие у него есть ограничения
Пример:
Представь девочку, которая мечтает выйти замуж за иностранца. Нам не нужно знать все о ней - достаточно знать эту главную цель. Тогда мы можем предсказать, что она:
- Будет учить иностранные языки
- Не будет встречаться с местными парнями
- Будет искать знакомства с иностранцами
Получается, что можно "создать" поведение человека, не создавая его полную копию. Достаточно знать его главные цели и принципы принятия решений.
Это как если бы вместо того, чтобы полностью копировать книгу, мы записали только её главную идею и основные правила, по которым развивается сюжет. Это занимает меньше места, но позволяет понять, о чем будет история.
Такая "легкая версия" человека может влиять на реальный мир через то, как другие люди предсказывают его поведение и реагируют на эти предсказания.
Полное объяснение:
Я попросил о1 pro (и deepseek) лучше объяснить, что он имел в виду. Получил три уровня объяснения:
1. Теории принятия решений и "вневременное" рассуждение
Эта идея напоминает Вневременную теорию принятия решений (TDT) Элиезера Юдковского, где агент может существовать "акаузально" - действуя на основе предсказаний того, как он будет вести себя в разных сценариях, тем самым формируя окружающую среду. Можно представить TDT-подобную сущность, которая никогда явно не воплощается, кроме как абстрактный процесс в вычислениях окружающей среды: среда (или другие агенты) предсказывают её ходы и соответственно адаптируются.
По моему мнению, возможные примеры: Бог и Василиск Роко.
Оба примера используют ключевую предпосылку TDT: важно то, как предсказания других агентов о вас влияют на их действия. Если окружение коллективно верит в возможные ответы гипотетической сущности, этого достаточно для изменения реальных решений - без необходимости постоянного воплощения в реальном времени.
2. Каждого человека можно аппроксимировать как принимающего решения агента с определенными параметрами:
Человек = {
Цели: [список_приоритетов, ценности]
Метод_принятия_решений: EDT/CDT
Горизонт_планирования: X месяцев/лет
Глубина_анализа: N уровней рекурсии
Вычислительные_ограничения: память, скорость обработки
Я могу предсказать важные для меня решения человека без полного его моделирования.
Например, я могу предсказать, что девушка не будет заинтересована в отношениях с местным парнем, если она интересуется иностранцами с высоким статусом.
3. Мы можем использовать контрфактуалы для предсказаний.
Контрфактуальная согласованность:
Решения демонстрируют сильные корреляции между возможными мирами. Если кто-то планирует международный брак, этот единственный факт распространяется через всю сеть решений:
Если (Цели_агента = "международный_брак") {
P(принятие_местных_свиданий) → низкая
P(изучение_иностранного_языка) → высокая
P(международный_нетворкинг) → высокая
}
Эти корреляции создают согласованную ткань решений, а не изолированные выборы.