Ученые комбинируют спутниковые данные и машинное обучение, чтобы составить карту бедности

В текущем выпуске журнала Science исследователи из Стэнфорда предлагают точный способ определения бедности в областях, ранее лишенных ценной информации обследования. Исследователи использовали машинное обучение — науку о разработке компьютерных алгоритмов, которые учатся на данных — для извлечения информации о бедности из спутниковых снимков с высоким разрешением.

В этом случае исследователи использовали более ранние методы машинного обучения, чтобы найти бедные районы в пяти африканских странах.«У нас есть ограниченное количество опросов, проведенных в разбросанных по всему африканскому континенту деревнях, но в остальном у нас очень мало информации о бедности на местном уровне», — сказал соавтор исследования Маршалл Берк, доцент кафедры науки о Земле в Стэнфорде и научный сотрудник Центр продовольственной безопасности и окружающей среды. «В то же время мы постоянно собираем всевозможные другие данные в этих областях — например, спутниковые снимки».Исследователи стремились понять, могут ли спутниковые снимки с высоким разрешением — нетрадиционный, но легкодоступный источник данных — дать информацию о том, где живут бедные люди.

Сложность заключалась в том, что, хотя стандартные подходы к машинному обучению работают лучше всего, когда они могут получить доступ к огромным объемам данных, в данном случае данных о бедности для начала было мало.«В мире мало мест, где мы можем с уверенностью сказать компьютеру, являются ли люди, живущие там, богатыми или бедными», — сказал ведущий автор исследования Нил Джин, докторант по информатике в Стэнфордской инженерной школе. «Это затрудняет извлечение полезной информации из огромного количества доступных дневных спутниковых изображений».

Поскольку участки с более яркой ночью обычно более развиты, решение заключалось в сочетании дневных изображений высокого разрешения с изображениями Земли в ночное время. Исследователи использовали данные «ночного света», чтобы определить особенности дневных изображений с более высоким разрешением, которые коррелируют с экономическим развитием.«Не говоря уже о том, что искать, наш алгоритм машинного обучения научился выделять из изображений многие вещи, которые легко узнать людям, — например, дороги, городские районы и сельхозугодья», — говорит Джин.

Затем исследователи использовали эти особенности дневных снимков для прогнозирования благосостояния на уровне деревни, как это было измерено в доступных данных опросов.Они обнаружили, что этот метод на удивление хорошо предсказывает распределение бедности, превосходя существующие подходы. Эти улучшенные карты бедности могут помочь организациям по оказанию помощи и политикам более эффективно распределять средства, а также принимать и оценивать политику более эффективно.

«Наша статья демонстрирует мощь машинного обучения в этом контексте», — сказал соавтор исследования Стефано Эрмон, доцент кафедры информатики и научный сотрудник Стэнфорд-Вудского института окружающей среды. «И поскольку он дешев и масштабируем — требуя только спутниковые снимки, — его можно использовать для картирования бедности во всем мире очень дешевым способом».