GeNemo решает насущную проблему: эффективный поиск функциональных геномных данных в онлайн-хранилищах данных. (Имя GeNemo представляет собой комбинацию «Ge» от слова «ген» и «Немо» из фильма «В поисках Немо».)Функции генома организма, зафиксированные в функциональных геномных данных, имеют прямое отношение к здоровью и болезням. Данные функциональной геномики фиксируют разнообразную активность каждой части генома организма.
Новая поисковая система может привести исследователей к раскрытию функциональных аспектов в определенных частях геномов, которые связаны с нормальной физиологией или заболеванием определенных органов и тканей.GeNemo запрашивает вводимые пользователем данные по функциональным геномным наборам данных онлайн, включая всю коллекцию наборов данных ENCODE и мыши ENCODE. В отличие от текстовых поисковых систем, поиск GeNemo основан на сопоставлении с образцом функциональных областей генома.Вместо простого «поиска по тексту» новый инструмент позволяет исследователям искать внутри функциональных данных.
Поиск паттернов связывания, аналогичных паттернам нового транскрипционного фактора, — лишь один из примеров.«Если вы думаете о файлах функциональных геномных данных как о видеофайлах, то« текстовый поиск »подобен поиску по ключевым словам в названии или описании видеофайла.« Поиск по внутренним данным »подобен поиску видеоклипа по шаблону. соответствие внутри самого видео ", — пояснил Чжун.«Функциональные геномные анализы производят огромные объемы данных в сложных типах данных.
Мы разработали онлайн-инструмент, который позволяет пользователям вводить любой полный или частичный набор функциональных геномных данных, например, файл интенсивности связывания, такой как bigWig, или файл пиков, "- объяснил ученый-биоинженер Калифорнийского университета в Сан-Диего Сяои Цао, один из первых авторов статьи. «GeNemo сообщает о любых областях генома, от 100 до 100 000 оснований, из любых онлайн-наборов данных ENCODE, которые имеют схожие функциональные шаблоны, такие как связывание, модификация и доступность».Возможности данных функционального геномного анализаИспользуя секвенирование ДНК, такое как высокопроизводительное считывание, функциональные геномные анализы могут исследовать распределение транскрипционного фактора по всему геному (ChIP-seq), эпигенетические модификации (ChIP-seq), регуляторные области (DNase-seq, FAIRE-seq) и другие функциональные результаты.
Результаты обычно сохраняются в виде значений интенсивности для всего генома (файлы WIG / bigWig) или функциональных областей генома (файлы пиков / BED). Эти типы данных создают новые проблемы для науки о больших данных.По словам исследователей, это первое программное обеспечение, выпущенное для выполнения функционального поиска геномных данных в Интернете.«Я очень рад видеть, как различные исследовательские группы со всего мира используют этот новый мощный инструмент, чтобы лучше использовать огромные объемы функциональных геномных данных, которые генерируются каждый день», — сказал Чжун.
Эта новая поисковая система, названная GeNemo, бесплатна для публичного использования по адресу: http://www.genemo.org.
