Совместное обучение - для роботов: новый алгоритм

Однако этот тип построения моделей усложняется в тех случаях, когда кластеры роботов работают как команды. Роботы могли собрать информацию, которая в совокупности создала бы хорошую модель, но по отдельности почти бесполезна. Если ограничения мощности, связи или вычислений означают, что роботы не могут объединить свои данные в одном месте, как они могут коллективно построить модель?

На июльской конференции «Неопределенность в искусственном интеллекте» исследователи из Лаборатории информации и систем принятия решений Массачусетского технологического института ответят на этот вопрос. Они представляют алгоритм, в котором распределенные агенты, такие как роботы, исследующие здание, собирают данные и анализируют их независимо. Пары агентов, таких как роботы, проезжают друг мимо друга в зале, затем обмениваются анализами.В экспериментах с несколькими различными наборами данных распределенный алгоритм исследователей фактически превзошел стандартный алгоритм, который работает с данными, агрегированными в одном месте.

«Перед одним компьютером стоит очень сложная задача оптимизации, чтобы изучить модель из одного гигантского пакета данных, и он может застрять в неудачных решениях», — говорит Тревор Кэмпбелл, аспирант по аэронавтике и космонавтике Массачусетского технологического института. который написал новую статью вместе со своим советником Джонатаном Хау, профессором аэронавтики и астронавтики Ричарда Кокберна Маклорена. «Если более мелкие фрагменты данных сначала обрабатываются отдельными роботами, а затем объединяются, окончательная модель с меньшей вероятностью застрянет в плохом решении».Кэмпбелл говорит, что работа была мотивирована вопросами о сотрудничестве роботов.

Но это также может иметь последствия для больших данных, поскольку это позволит распределенным серверам объединять результаты своих анализов данных без агрегирования данных в центральном месте.«Эта процедура абсолютно надежна практически для любой сети, о которой вы только можете подумать, — говорит Кэмпбелл. «Это очень гибкий алгоритм обучения для децентрализованных сетей».Проблема соответствияЧтобы понять проблему, которую решили Кэмпбелл и Как решили, представьте команду роботов, исследующих незнакомое офисное здание.

Если их алгоритм обучения достаточно общий, они не будут иметь никакого предварительного представления о том, что такое стул или стол, не говоря уже о конференц-зале или офисе. Но они могли определить, например, что некоторые комнаты содержат небольшое количество предметов в форме стульев вместе с примерно таким же количеством предметов в форме стола, в то время как другие комнаты содержат большое количество предметов в форме стульев вместе с одним столом. фигурный объект.Со временем каждый робот создаст собственный каталог типов комнат и их содержимого. Но могут возникать неточности: например, один робот может случайно натолкнуться на конференц-зал, в котором какой-то путешественник оставил чемодан, и прийти к выводу, что чемоданы являются обычным атрибутом конференц-залов.

Другой может войти на кухню, когда кофеварка закрыта открытой дверцей холодильника, и кофеварка не останется в его кухонном инвентаре.В идеале, когда два робота сталкиваются друг с другом, они сравнивают свои каталоги, подкрепляя взаимные наблюдения и исправляя упущения или чрезмерные обобщения. Проблема в том, что они не знают, как сопоставлять категории. Ни один из них не знает ярлыка «кухня» или «конференц-зал»; у них просто есть такие ярлыки, как «комната 1» и «комната 3», каждая из которых связана с разными списками отличительных черт.

Но комната 1 одного робота может быть комнатой 3 другого робота.С помощью алгоритма Кэмпбелла и Хау роботы пытаются сопоставить категории на основе элементов общего списка. Это обязательно приведет к ошибкам: один робот, например, мог сделать вывод, что раковины и мусорные баки с педальным управлением являются отличительными чертами ванных комнат, а другой — что они являются отличительными чертами кухонь.

Но они стараются изо всех сил, комбинируя списки, которые, по их мнению, совпадают.Когда любой из этих роботов встречает другого робота, он выполняет ту же процедуру, насколько это возможно, сопоставляя списки. Но вот решающий шаг: затем он независимо извлекает каждый из исходных списков и повторно сопоставляет его с другими, повторяя этот процесс до тех пор, пока не переупорядочит результаты. Он делает это снова с каждым новым роботом, с которым сталкивается, постепенно строя все более точные модели.

Наведение порядкаЭта относительно простая процедура является результатом довольно сложного математического анализа, который исследователи представляют в своей статье. «В наши дни компьютерные системы изучают эти сложные модели: вы постулируете более простую модель, а затем используете ее для аппроксимации того, что вы получили бы, если бы смогли справиться со всеми безумными нюансами и сложностями», — говорит Кэмпбелл. «Наш алгоритм как бы искусственно воссоздает структуру после того, как вы решите эту более простую задачу, а затем использует эту искусственную структуру для правильного объединения моделей».

В реальном приложении роботы, вероятно, будут не просто классифицировать комнаты в соответствии с объектами, которые они содержат: они также будут классифицировать сами объекты и, возможно, их использование. Но процедура Кэмпбелла и Хау также обобщается и на другие проблемы обучения.Пример классификации комнат по содержанию, кроме того, аналогичен по структуре классической задаче обработки естественного языка, называемой тематическим моделированием, в которой компьютер пытается использовать относительную частоту слов для классификации документов по теме.

Было бы крайне непрактично хранить все документы в Интернете в одном месте, чтобы традиционный алгоритм машинного обучения мог обеспечить согласованную схему классификации для всех из них. Но алгоритм Кэмпбелла и Хау означает, что разрозненные серверы могут обрабатывать документы в своих уголках Интернета и при этом создавать коллективную тематическую модель.«Распределенные вычисления будут играть решающую роль в развертывании множества автономных агентов, таких как несколько автономных наземных и бортовых транспортных средств», — говорит Лоуренс Карин, профессор электротехники и вычислительной техники и вице-проректор по исследованиям в Университете Дьюка. «Распределенный вариационный метод, предложенный в этой статье, является эффективным и практичным с вычислительной точки зрения.

Одним из ключей к нему является метод обработки нарушения симметрии, проявляющегося в байесовском выводе. Решение этой проблемы является очень новым и, вероятно, будет использовано в будущее другими исследователями ".