Продолжение поста, в которой Дмитрий Крюков сжигает смысл работы всех Longevity клиник, деятельность которых всегда построена на измерениях разнообразных биологических часов старения
…Профиль метилирования ДНК (более известный как эпигеном) является пожалуй наиболее популярным на сегодняшний день источником данных для построения упомянутых часов старения.
Беда в том, что интерпретировать омиксные данные очень непросто, ввиду их полной неинтуитивности. Действительно, что вам говорит, что цитозин на 1004003 позиции вашей 2-ой хромосмы имеет среднее метилирование 45%?
Мало какой биолог сможет внятно ответить на этот вопрос. Но там где наша интуиция покидает нас, раскрывается целое поле для интерпретаций, а если говорить открыто, спекуляций.
Сотни и сотни статей были опубликованы по всевозможным позициям метилирования ДНК, которые предсказывают хронологический возраст, пол, вероятность тех или иных болезней, смертность от всех причин.
Каждое исследование оперирует своим собственным датасетом, обучает модель, и, как следствие, получает свой уникальный набор позиций метилирования, которые слабо воспроизводятся между исследованиями, и конечно же ударяются в многообразные спекуляции на тему того что все это значит.
Почему данный сайт находится в промоторе этого гена? А как этот ген связан со старением? А почему бы нам не рассмотреть комбинацию всех сайтов ранее найденных всеми другими исследователями и все гены, в окрестностях этих сайтов? …
В итоге, 15 лет поисков сигнатуры старения по данным метилирования ДНК не привели ни к какому консенсусу.
Ученые совершенно не подобрались к фундаментальным причинам старения, зато наплодили сотни статей, спекулирующих порой над (понятными любому математику) парадоксами и ограничениями выбранных ими AI моделями, а если вспомнить, что есть и другие омиксные данные (транскриптомика, метаболомика итд), то счет пойдет за тысячи.
Нужно ли говорить, что кормление всех этих статей в GPTo1 с просьбой суммаризировать не приведет вас ни к какому верному умозаключению об эпигенетических сигнатурах старения, а скорее даже запутает?
Рассматривая эту ситуацию с разных сторон в течение нескольких последних лет, я пришел к несколько радикальному, но кажется честному выводу:
Top-Down подход не поможет нам разобраться в биологии старения!
Не то чтобы он в принципе не способен нам помочь, очевидно, что современный AI работающий на этом принципе оказывается полезен, но он не способен помочь нам в научном поиске и ответе на наши вопросы.
Причиной тому огромный навес когнитивных искажений с которым вынужден считаться исследователь, попытавшийся интерпретировать веса модели в области знаний, где явно не стоит полагаться на интуицию.
Мощнейший аналитический инструмент оказывается бесполезен ввиду ограниченности мышления его создателя. Увы, так.
Подытоживая, я считаю, что часы старения могут быть полезным клиническим инструментом, но только если разрабатываются Bottom-Up.
Top-down подход полезен для хорошо формализованных практических задач, таких как перевод текста или распознавание изображений.
Однако в современной науке издержки этого подхода сильно перевешивают пользу от использования, поэтому всякий, кто берется за него, должен быть втройне осторожен.
Этот подход уже нанес огромный ущерб longevity в части поиска биомаркеров старения, тем, что отвлек огромное количество людей от сложных, нудных, но стратегически правильных bottom-up аналитических построений и экспериментов.
Блин, что-то много получилось))