
Интересно, что только небольшая часть генома человека (около 2%) содержит гены, кодирующие белки, которые являются строительными блоками клетки. Остальные 98% важны для регулирования, а это означает, что они участвуют в контроле, когда и где гены активны. Эта большая часть генома производит молекулы РНК, называемые некодирующими РНК, которые различаются по размеру, структуре и функциям. Поскольку разные типы некодирующих РНК могут по-разному взаимодействовать с белками, большие усилия были приложены к их исследованию.
До сих пор не было доступных вычислительных инструментов для обработки очень длинных последовательностей РНК, и изучение их экспериментальными методами в настоящее время является огромной проблемой.
В недавней статье, опубликованной в Nature Methods, исследователи из Центра геномной регуляции в Барселоне (Испания) в сотрудничестве с учеными из офиса EMBL в Монтеротондо (Италия) и Калифорнийского технологического института (США) представили новый вычислительный инструмент для предсказывать взаимодействия белков с длинными некодирующими РНК, которые они подтвердили с помощью передовых экспериментальных методов.
"Длинные некодирующие РНК взаимодействуют с различными белками, опосредуя важные клеточные функции.
Попытка идентифицировать эти взаимодействия может быть хорошей отправной точкой для понимания роли этих молекул в нормальном функционировании клетки, но также и в заболевании », — объясняет Джан Гаэтано Тарталья, профессор исследований ICREA в Центре геномной регуляции (CRG). и главный исследователь этой статьи.
Новый вычислительный инструмент, который называется Global Score, позволяет ученым предсказать, где в последовательности некодирующей РНК белок установит физический контакт. Для этого этот алгоритм учитывает не только глобальную склонность белка связывать определенную РНК, но и локальные особенности такого связывания. «Структура РНК абсолютно важна при прогнозировании белковых взаимодействий.
Наша главная задача заключалась в том, чтобы иметь возможность работать с последовательностями РНК независимо от их длины, чтобы иметь полное представление об их структурных свойствах при поиске белковых партнеров », — добавляет Давид Чирилло, постдокторский исследователь из CRG и первый автор бумага. «Разработанный нами алгоритм объединяет эту информацию и позволяет нам не только прогнозировать белковые партнеры, но и определять их приоритетность для экспериментальной проверки. Этот методологический прогресс будет иметь решающее значение для лучшего изучения длинных некодирующих РНК и их функций », — заключает исследователь.
В этой работе снова подчеркивается значительный вклад биоинформатики и вычислительной биологии в продвижение знаний и их ключевая роль в стимулировании и ускорении исследований в области наук о жизни.
