Дэниел Пелт и Джеймс Сетиан из Центра передовой математики для приложений энергетических исследований (CAMERA) лаборатории Беркли перевернули привычный взгляд на машинное обучение с ног на голову, разработав то, что они называют «нейронной сетью с плотной сверткой смешанного масштаба (MS-D)», которая требует гораздо меньше параметров, чем традиционные методы, быстро сходится и имеет возможность «учиться» на удивительно небольшом обучающем наборе. Их подход уже используется для извлечения биологической структуры из изображений клеток и готов предоставить новый крупный вычислительный инструмент для анализа данных в широком диапазоне областей исследований.Поскольку экспериментальные установки генерируют изображения с более высоким разрешением на более высоких скоростях, ученым трудно управлять и анализировать полученные данные, что часто делается кропотливо вручную. В 2014 году Сетиан основал CAMERA в лаборатории Беркли в качестве интегрированного междисциплинарного центра для разработки и предоставления новых фундаментальных математических методов, необходимых для извлечения выгоды из экспериментальных исследований в пользовательских объектах Управления науки Министерства энергетики США.
КАМЕРА является частью отдела вычислительных исследований лаборатории.«Во многих научных приложениях требуется колоссальный ручной труд, чтобы аннотировать и маркировать изображения — могут потребоваться недели, чтобы создать несколько тщательно очерченных изображений», — сказал Сетиан, который также является профессором математики в Калифорнийском университете в Беркли. «Нашей целью было разработать методику обучения на очень небольшом наборе данных».Подробности алгоритма были опубликованы 26 декабря 2017 г. в статье в Proceedings of the National Academy of Sciences.«Прорыв стал результатом осознания того, что обычное масштабирование и масштабирование, которое захватывает функции в различных масштабах изображения, может быть заменено математическими свертками, обрабатывающими несколько масштабов в одном слое», — сказал Пелт, который также является членом группы вычислительной визуализации в Центре.
Вискунде Informatica, национальный исследовательский институт математики и информатики в Нидерландах.Чтобы сделать алгоритм доступным для широкого круга исследователей, команда из Беркли во главе с Оливией Джейн и Саймоном Мо создала веб-портал «Segmenting Labeled Image Data Engine (SlideCAM)» как часть набора инструментов CAMERA для экспериментальных объектов DOE.Одно из многообещающих приложений — понимание внутренней структуры биологических клеток и проект, в котором методу MS-D Пелта и Сетиана потребовались только данные из семи клеток для определения клеточной структуры.
«В нашей лаборатории мы работаем, чтобы понять, как клеточная структура и морфология влияют на поведение клеток или контролируют их. Мы тратим бесчисленные часы, вручную сегментируя клетки, чтобы извлечь структуру и выявить, например, различия между здоровыми и больными клетками», сказала Кэролайн Ларабелл, директор Национального центра рентгеновской томографии и профессор Медицинской школы Сан-Франциско Калифорнийского университета. «Этот новый подход может радикально изменить нашу способность понимать болезни и является ключевым инструментом в нашем новом спонсируемом Чаном-Цукербергом проекте по созданию Атласа клеток человека, глобального сотрудничества для картирования и описания всех клеток здорового человека. тело."Получение большего количества науки с меньшим количеством данных
Изображения повсюду. Смартфоны и сенсоры создали кладезь изображений, многие из которых содержат соответствующую информацию, идентифицирующую контент.
Использование этой обширной базы данных изображений с перекрестными ссылками, сверточных нейронных сетей и других методов машинного обучения революционизировало нашу способность быстро идентифицировать естественные изображения, которые выглядят так же, как ранее просмотренные и каталогизированные.Эти методы «обучаются», настраивая потрясающе большой набор скрытых внутренних параметров, руководствуясь миллионами помеченных изображений и требуя большого количества времени суперкомпьютера. Но что, если у вас не так много изображений с тегами? Во многих областях такая база данных — недостижимая роскошь.
Биологи записывают изображения клеток и тщательно обрисовывают границы и структуру вручную: нередко один человек тратит недели на создание единого полностью трехмерного изображения. Материаловеды используют томографическую реконструкцию, чтобы заглянуть внутрь горных пород и материалов, а затем засучить рукава, чтобы пометить различные области, идентифицируя трещины, трещины и пустоты вручную. Контрасты между различными, но важными структурами часто очень малы, и «шум» в данных может маскировать особенности и сбивать с толку лучшие алгоритмы (и людей).Этих драгоценных изображений, созданных вручную, недостаточно для традиционных методов машинного обучения.
Чтобы решить эту проблему, математики из CAMERA приступили к решению проблемы машинного обучения на очень ограниченных объемах данных. Пытаясь сделать «больше с меньшими затратами», их целью было выяснить, как построить эффективный набор математических «операторов», которые могли бы значительно сократить количество параметров.
Эти математические операторы могут естественным образом включать ключевые ограничения для помощи в идентификации, например, путем включения требований к научно правдоподобным формам и образцам.Плотные сверточные нейронные сети смешанного масштабаМногие приложения машинного обучения к задачам визуализации используют глубокие сверточные нейронные сети (DCNN), в которых входное изображение и промежуточные изображения сворачиваются в большое количество последовательных слоев, что позволяет сети изучать сильно нелинейные функции. Для достижения точных результатов при решении сложных задач обработки изображений DCNN обычно полагаются на комбинации дополнительных операций и соединений, включая, например, операции уменьшения и увеличения масштаба для захвата функций в различных масштабах изображения.
Для обучения более глубоких и мощных сетей часто требуются дополнительные типы слоев и соединения. Наконец, DCNN обычно используют большое количество промежуточных изображений и обучаемых параметров, часто более 100 миллионов, для достижения результатов для сложных задач.
Вместо этого новая сетевая архитектура «Mixed-Scale Dense» позволяет избежать многих из этих сложностей и вычисляет расширенные свертки в качестве замены операций масштабирования для захвата объектов в различных пространственных диапазонах, используя несколько масштабов в пределах одного слоя и плотно соединяя все промежуточные изображения. Новый алгоритм позволяет получать точные результаты с использованием небольшого количества промежуточных изображений и параметров, устраняя необходимость настройки гиперпараметров и дополнительных слоев или соединений для обучения.Получение науки с высоким разрешением из данных с низким разрешениемДругая задача — создать изображения с высоким разрешением из входного сигнала с низким разрешением.
Любой, кто пытался увеличить маленькую фотографию и обнаружил, что по мере того, как она становится больше, становится только хуже, это звучит почти невозможно. Но небольшой набор обучающих изображений, обработанных с помощью сети смешанного масштаба с плотностью, может обеспечить реальный прогресс. В качестве примера представьте попытку шумоподавления томографических реконструкций армированного волокном мини-композитного материала. В эксперименте, описанном в статье, изображения были реконструированы с использованием 1024 полученных рентгеновских проекций для получения изображений с относительно низким уровнем шума.
Затем были получены зашумленные изображения того же объекта путем реконструкции с использованием 128 проекций. В качестве входных данных для обучения использовались зашумленные изображения, а соответствующие бесшумные изображения использовались в качестве целевых выходных данных во время обучения. Затем обученная сеть смогла эффективно принимать зашумленные входные данные и восстанавливать изображения с более высоким разрешением.Новые приложения
Пелт и Сетиан применяют свой подход к множеству новых областей, таких как быстрый анализ в реальном времени изображений, исходящих от источников синхротронного света, и проблемы восстановления при биологической реконструкции, например, для клеток и картирования мозга.«Эти новые подходы действительно интересны, поскольку они позволят применять машинное обучение к гораздо большему разнообразию задач визуализации, чем это возможно в настоящее время», — сказал Пелт. «За счет уменьшения количества требуемых обучающих изображений и увеличения размера изображений, которые могут быть обработаны, новую архитектуру можно использовать для ответа на важные вопросы во многих областях исследований».
