Более 18 000 часов потрачено на аннотирование изображений. Синтетические данные в сочетании с глубоким обучением могут изменить ситуацию.

Астероиды могут содержать секреты происхождения Вселенной и могут иметь коммерческое применение, включая добычу полезных ископаемых, космические станции и торговлю. Астероид Бенну был выбран НАСА в 2016 году в рамках Миссии OSIRIS-REx, поскольку он может предоставить информацию о происхождении нашей Солнечной системы и улучшить понимание астероидов, которые могут столкнуться с Землей.

Однако посадка зонда на астероид может потребовать тысячи часов работы для определения безопасных зон на поверхности. Это может быть еще более сложным, когда есть камни размером с ваш кулак вплоть до размера дома или больше.

Исторически сложилось так, что сбор необходимых данных изображения трудновыполним из-за отсутствия изображений с аннотациями горных пород, разнообразной природы поверхностей астероидов и учета предвзятости интерпретации человеком при ручной идентификации горных пород. Определение того, что такое «камень», может означать разные вещи для разных людей.

В этой статье я рассматриваю ценность решения этой проблемы. В следующей статье этой серии я оцениваю несколько архитектур глубокого обучения и их способность находить места приземления на астероиде Бенну, обучаясь только на синтетических данных изображений. В конце концов, я построил модель сегментации изображений, которая лучше, чем стандартная для отрасли U-Net, но при этом составляет всего 4,5% размера и сложности.

Это большое дело

Космический корабль OSIRIS-REx был запущен к Бенну 8 сентября 2016 года. Ожидалось, что астероид будет иметь песчаную поверхность, похожую на пляж. Однако, когда OSIRIS-REx прибыл в Бенну в 2018 году, поверхность была очень каменистой. Это стало сложной задачей для НАСА. Чтобы определить потенциальные места посадки, необходимо было подсчитать человеческим глазом отдельные валуны на поверхности Бенну, используя по одному изображению за раз. Для решения этой масштабной задачи НАСА привлекло около 3500 добровольцев из гражданской научной кампании CosmoQuest Bennu Mappers.

Добровольцам требовалось до 45 минут на изображение, при этом 98 лучших добровольцев отметили не менее 100 изображений. Если 98 лучших добровольцев потратили 45 минут на изображение, это означает, что не менее 18 375 часов были потрачены на ручную маркировку камней.

Поскольку процесс аннотирования основан на коллективных наборах данных и повторяющейся ручной работе, становится очевидным, что машинное обучение может оказать огромное влияние на скорость, качество и эффективность миссий НАСА.

Почему синтетические данные для миссий по астероидам

Вам может быть интересно, зачем использовать синтетические изображения? На это есть две основные причины — доступность и качество доступных изображений.

Качество космических снимков

Как вы можете себе представить, учитывая относительную редкость полетов к астероидам и другим небесным телам, качество изображения сильно различается. Это может быть связано с технологией, доступной во время миссии, типом выполняемой миссии (например, разведка, добыча и т. д.) и расстоянием от самого астероида.

Миссия NEAR Shoemaker в 2001 году даже разбила зонд о поверхность астероида 443 Эрос. По пути вниз были сделаны снимки, и зонд продолжал работать. Вдобавок ко всему, качество камеры 2001 года, снятой с движущегося в космосе зонда и отправленной обратно на Землю, не совсем способствует машинному обучению.

Фактически, в нашей истории было всего около трех успешных крупных миссий к астероидам. Этому способствует отсутствие доступных изображений поверхности астероидов.

Эти миссии:

  • Миссия NEAR Shoemaker на Эрос (~ 2001 г.)
  • Миссия Хаябуса в Итокава (~ 2005 г.)
  • Миссия Хаябуса-2 на Рюгу (~ 2018–2019 гг.)

Доступность космических изображений

Хотя большинство изображений находятся в открытом доступе в архивах миссий НАСА, не все программы или сбор данных одинаковы. У разных миссий на астероидах разные цели. Некоторые миссии направлены на сбор образцов, фотографирование, научные тесты, изучение поведения астероидов, либо все это, либо ничего из этого. Если визуальные изображения недостаточно качественные, то их могут не публиковать. Конечно, все это зависит от того, какое космическое агентство проводит исследование. Также обычно публикуется много статей, но наборы данных и изображения могут быть недоступны для открытого использования.

Однако фотографии поверхности астероида Бенну, сделанные OSIRIS-Rex, представляют собой изображения небесного тела с самым высоким разрешением, которые были собраны до сих пор. Благодаря тому, что НАСА вручную прочесывает поверхность астероида в поисках площадок для посадки, а также доступны синтетические данные, это обеспечивает оптимальные условия для обучения модели машинного обучения и ее тестирования на реальной поверхности астероида. Будем надеяться, что эта миссия устанавливает стандарт качества сбора изображений.

Чтобы увидеть, как я использовал изображения поверхности Бенну из Научного центра астрогеологии Геологической службы США и Набор данных искусственного лунного ландшафта от Kaggle для построения модели для поиска участков на Бенну, свободных от камней, ознакомьтесь с моей следующей статьей из этой серии. : Глубокое обучение и синтетические данные для приземления на астероид.

Если вы хотите более глубокого погружения, вы можете найти мою полную статью здесь: Автономное обнаружение горных пород для миссий астероидов с использованием глубокого обучения и синтетических данных | Северо-западный университет

Хотите узнать больше о науке о данных? Следите за мной здесь, на Medium, или свяжитесь со мной в LinkedIn.