если мы решим эту задачу методами «честной» физики, то
получим Нобелевскую Премию
...впрочем, и за «нечестное» решение - получим!
Такие слова напутствия я услышал от Владимира Гаевича Туманяна, моего научного руководителя, при поступлении в 2000 г. в аспирантуру родного МФТИ. Мне предстояло выбрать тему будущей диссертации. Кстати, ТВГ - как его, «сокращённо» и любя, называли коллеги - был человеком, создавшим замечательную научную школу в области физики полимеров, биоинформатики, и вообще теоретических методов в биологии. Достаточно сказать, что в моих рассказах появится ещё немало его учеников, ныне разбросанных по всему миру и ставших, что называется, opinion-leader’ами в своих научных направлениях. Ну а сейчас, возвращаясь к тому далёкому времени:
Задача, о которой шла речь, до сих пор остаётся одной из главных проблем физики в биологии. Речь о предсказании структур белков по последовательности их аминокислотных звеньев. Более того, в своей самой высокой «ипостаси» эта задача напрямую связана со «священным граалем» Науки о Жизни - с задачей предсказания фенотипа по генотипу.
Прошу прощения, если последующие абзацы будут слишком просты и очевидны тем, кто уже хорошо знает базис молекулярной биологии - но на всякий случай объясню суть обсуждаемой задачи:
Белки - главные функциональные молекулы живых организмов - представляют собою цепочки звеньев одной химической природы, так называемых остатков аминокислот. Типов звеньев немного - два десятка - но они могут быть соединены в ооочень длинные последовательности, где эти звеньях будут чередоваться самым разнообразным образом. Примечательно, что большинство белков формируют весьма стабильные пространственные структуры - цепи сворачиваются в очень плотные «клубки» - и формы этих структур, как правило, определяют функцию белков, по этим формам можно разобраться, что белки проводят какую-то химическую реакцию, или взаимодействуют друг с другом, и пр... Кодируется белковая последовательность «на уровень ниже» - через молекулы ДНК и РНК, которые тоже являются биополимерами (только звенья там иной природы -нуклеотиды). Расшифровать последовательности белков, ДНК, РНК становится всё проще и дешевле - потому при желании можно без труда узнать порядок, в котором соединены звенья. А вот определять пространственные структуры белковых молекул - а значит, понимать их функции - мы по-прежнему можем с большим трудом и в довольно недешёвых экспериментах.
В общем, если бы адекватная физическая модель дала нам возможность точно рассчитать взаимодействия звеньев и форму, в которую свернётся их цепь - это было бы огромным подспорьем для Науки, мы бы стали лучше понимать и фундаментальные процессы Жизни, и механизмы развития болезней, и могли бы создавать новые эффективные лекарства от множества пока неизлечимых болезней…
Но физическое моделирование в те времена, когда я начинал путь в науке и поступал в в аспирантуру, не позволяло вести сколь-либо точные расчёты структур белков. Потому многие биоинформатики (учёные, занимающиеся компьютерным анализом биологических данных) пытались придумать методы, которые каким-то не-прямым не-совсем- (или совсем-не-) физическим образом предсказали бы, во что сворачивается белковая цепь. Среди таких людей был и я. И для начала, мы (с ТВГ и коллегами) решили просто по-изучать свойства фрагментов, из которых состоят больше белковые цепи. Их ещё называют «олигопептиды» - т.е. короткие пептиды, или небольшие последовательности аминокислот, длиной этак в 3-4-5 аминокислотных остатков.
⬇️ ... ⬇️