Программное обеспечение Scanpy обрабатывает огромные объемы данных отдельных ячеек.

«Речь идет об анализе информации об экспрессии генов огромного количества отдельных клеток», — растолковывает ведущий создатель Алекс Вольф из Университета вычислительной биологии (ICB) в Центре им. Гельмгольца в Мюнхене. Он создал Scanpy совместно со своим сотрудником Филиппом Ангерером из группы машинного обучения профессор доктора Фабиана Тайса. Не считая должности в Центре Гельмгольца, Тайс также имеется профессор математического моделирования биологических совокупностей в Техническом университете Мюнхена. «Новые технические удачи разрешают генерировать на пара порядков больше данных с, соответственно, более высоким информационным содержанием», — говорит Тайс. «Но исторически сложившаяся программная инфраструктура для анализа экспрессии генов просто не была создана для ответа новых задач.

Исходя из этого необходимы новые аналитические методы».Гонка за Атлас клеток человекаПо словам Тайса, это ПО может также принести пользу громадному интернациональному исследовательскому проекту.

Пара интернациональных ученых образовывает справочную базу данных именующиеся «Атлас клеток человека», в которой сохраняются данные об активности генов всех типов клеток человека. «Для этого проекта, и для растущего числа вторых проектов, в которых объединены базы данных, очень важно иметь масштабируемое ПО», — говорит Тайс. Исходя из этого неудивительно, что Сканпи сейчас имеется кандидатом на помощь в анализе Атласа клеток человека.«Публикация Scanpy знаменует собой первое ПО, которое разрешает проводить всесторонний анализ громадных наборов информации об экспрессии генов при помощи многих способов статистических машинного обучения и методов», — растолковывает Вольф, обрисовывая личный достижение. «ПО уже употребляется рядом групп в мире, в особенности в Университете Броуд Гарвардского университета и Массачусетском технологическом университете, Массачусетский технологический университет».С технологической точки зрения приложение имеется новаторским: в то время как программы биостатистики традиционно пишутся на языке программирования R, Scanpy основан на языке Python, главном языке в сообществе машинного обучения.

Еще одна новая изюминка содержится в том, что способы на базе графов лежат в базе Scanpy. В отличие от несложного подхода, рассматривающего клетки как точки в совокупности координат в пространстве экспрессии генов, способы используют совокупность координат, подобную графу. Вместо того, чтобы характеризовать отдельную клетку значением экспрессии тысяч генов, совокупность клетки, определяя их ближайших соседей — очень похоже на связи в соцсетях.

Фактически, для определения типов ячеек Scanpy использует те же способы, что и Facebook для определения сообществ.


Портал обо всем