«Алгоритм развивает методы биологического моделирования, обеспечивая более глубокое понимание того, какие отдельные гены участвуют в данном биологическом ответе, а также какие факторы окружающей среды влияют на поведение этого гена», — говорит Кранос Уильямс, автор-корреспондент статьи, описывающей работу и ассоциированную профессор электротехники и вычислительной техники в Государственном университете Северной Каролины.
«Сузив поле с тысяч возможных генов до менее 10, биологам будет намного легче понять, как вывести засухоустойчивые культуры или растения, которые могут процветать в среде с низким содержанием питательных веществ», — говорит Уильямс. "Это ключ, который может открыть доступ к большому количеству исследований в области биологии растений с помощью реальных приложений."
Чтобы биологическая модель работала, ей нужны данные.
В этом случае данные поступают от воздействия на растение стресса.
Исследовательская группа начала с набора модельных видов растений Arabidopsis thaliana, растущих в нормальных условиях. Были взяты образцы растений, чтобы определить, какие гены активны и насколько они активны.
Затем растения подвергались экологическому стрессу, помещаясь в среду с дефицитом железа. Образцы растений отбирались с заданными интервалами в течение трех дней, чтобы определить, как активность генов изменяется в каждый момент времени.
Исследователи хотели знать, как растения реагировали на стресс и какие гены были ответственны за запуск этих реакций.
Но это создало проблему. Происходила большая активность генов. И было трудно сказать, какие гены связаны с какими функциями или какие гены служат «факторами транскрипции», которые действительно повлияли на реакцию растения на стресс. Фактически, исследователи обнаружили активность в 2700 различных генах — слишком много, чтобы проверить все возможные варианты в лаборатории.
Здесь на помощь приходит новый алгоритм моделирования. Исследователи включили в алгоритм все данные об активности генов, и алгоритм предсказал, что семь генов или факторов транскрипции участвуют в инициировании стрессовой реакции растения, связанной с дефицитом железа. Это было достаточно мало, чтобы проверить.
Фактор транскрипции похож на первое домино в серии. Он подает один небольшой сигнал, который затем влияет на значительную активность «целевых» генов, которые гораздо более активны в определении того, как растение реагирует на стресс. Исследователи определили, что необработанные данные, показывающие активность 2700 генов, представили 931 возможную взаимосвязь фактора транскрипции / целевого гена.
Опять слишком много, чтобы проверить.
Но алгоритм сузил его до 32 предсказанных влиятельных взаимосвязей между факторами транскрипции и генами-мишенями. И, опять же, это было достаточно маленькое число, чтобы проверить.
Когда результаты алгоритма были протестированы в лаборатории, исследователи обнаружили, что четыре из семи предсказанных генов являются релевантными факторами транскрипции.
Они также обнаружили, что 17 из 32 предсказанных влиятельных отношений — 53 процента — оказались точными. Из четырех утвержденных факторов транскрипции ни один ранее не был связан с депривацией железа.
«Мы перешли от тысячи генов к семи и с 931 возможных отношений до 32, что позволило идентифицировать соответствующие гены и взаимодействия за недели, а не десятилетия», — говорит Уильямс.
«Что этот алгоритм делает для биологов растений, так это значительно ограничивает количество интересных генов-кандидатов для изучения, тем самым уменьшая количество времени, энергии и средств, необходимых для идентификации важных генов, участвующих в реакции на стресс», — говорит Терри Лонг, другой соответствующий специалист. автор статьи и доцент кафедры биологии растений и микробов в NC State.