Оглавление

1. Введение"

2. Характер спутниковых снимков.

3. Проблемы работы со спутниковыми изображениями

1. Введение

Технология наблюдения Земли существует уже почти столетие. Первый спутниковый снимок мира был сделан в 1959 году американским Explorer 6 (Википедия), и с тех пор технология непрерывно развивается. Однако вначале спутниковые изображения использовались лишь небольшой группой людей и организаций из-за трудностей доступа. Спутниковые изображения начали набирать популярность только в последние несколько десятилетий, когда НАСА и Европейское космическое агентство сделали данные с нескольких спутников, таких как MODIS, Landsat и Sentinel, в свободном доступе.

2. Персонажи спутниковых снимков.

Спутниковые изображения имеют очень разные характеры от обычных изображений, с которыми мы все знакомы. Ключевые различия между ними заключаются в следующем:

Количество каналов. Обычное изображение имеет 3 канала, представляющих интенсивность каждого из основных цветов: красного, зеленого и синего. С другой стороны, спутниковые снимки могут содержать от 6 до 12 каналов в зависимости от принимающего спутника. Например, на Sentinel-2 установлен Multispectral Imager (MSI), который обеспечивает 13 спектральных полос с размером пикселя от 10 до 60 метров. Что это за дополнительные каналы? Дополнительные каналы отражают сигналы с разных длин волн. Фактически, все они очень похожи по концепции на каналы RGB, за исключением того, что эти сигналы не видны человеческому глазу. Популярные типы сигналов, которые обычно встречаются на спутниковых изображениях, - это инфракрасный (ИК), ближний инфракрасный (NIR) и коротковолновый инфракрасный (SWIR). Причина того, что эти сигналы выбраны, заключается в том, что они могут дать очень полезную информацию о поверхности земли благодаря своим свойствам. Например, сигнал в ближнем инфракрасном диапазоне очень чувствителен к хлорофиллу, поэтому его можно использовать, чтобы указать, какая географическая область является растительностью.

Размер изображения. Еще одно ключевое отличие спутникового изображения от обычного - это размер изображения. Обычно, когда специалисты по обработке данных проводят анализ данных или машинное обучение на основе данных изображений, эти изображения имеют ширину и высоту не более нескольких сотен пикселей. Напротив, разрешение спутниковых снимков колеблется от 5000x5000 до 10000x10000. Это в 100–400 раз больше по количеству пикселей, и не забывайте, что у него как минимум в два раза больше каналов. Это означает, что вам приходится иметь дело с гораздо большим объемом данных.

Разница в разрешении каналов. Еще одна особенность спутникового изображения, которого нет на обычном изображении, - это то, что каналы имеют разное разрешение. Как упоминалось ранее, спутниковое изображение состоит из изображений, каждое из которых исходит от сигнала с разной длиной волны. Датчики, которые используются для получения этих изображений, имеют разное пространственное разрешение. Таким образом, снимок, сделанный со спутника, несмотря на то, что он находится в одном и том же географическом месте, имеет разное разрешение.

Эти 3 свойства делают работу со спутниковыми снимками, требующими подхода, отличного от стандартного RGB-изображения, как с точки зрения обработки данных, так и с точки зрения метода анализа и алгоритмов.

3. Проблемы работы со спутниковыми изображениями

В предыдущем разделе мы обсудили уникальные символы спутниковых снимков. В этой части мы собираемся обсудить некоторые проблемы, с которыми специалисты по обработке данных сталкиваются при работе с этим типом данных.

Уменьшение размера изображения. Использовать исходное изображение при работе со спутниковыми снимками практически невозможно из-за его огромных размеров. Наиболее распространенный метод решения этой проблемы - разделение изображений на несколько фрагментов. Однако разделение изображений может повлиять на производительность вашего алгоритма. Например, если вы строите модель обнаружения объекта, интересующий объект может быть разделен на части, что затруднит обнаружение или даже сделает его невозможным.

Облако. Спутниковые снимки сделаны на высоте сотен километров над землей. Это означает, что атмосферные условия могут мешать процессу сбора данных. Когда появляются облака, измерения в этих конкретных областях очень зашумлены. Самый простой способ обойти эту проблему - не использовать данные из этих облачных пикселей. Однако, если ваши области интереса находятся в этих пикселях, это может быть недопустимым вариантом. В этом сценарии вам потребуются другие решения, такие как использование изображения из другого времени или замена облачных пикселей некоторыми значениями.

Отсутствие достоверной информации. Большинство работ по машинному обучению требует достоверной информации, а важность помеченных данных хорошо известна специалистам, практикующим машинное обучение. Обычно достоверную информацию создают специалисты по маркировке данных, которые хорошо разбираются в проблеме. В отличие от работы со стандартными изображениями, когда специалисты по маркировке данных могут быть обучены понимать проблему за короткий период времени, люди, которые могут эффективно маркировать спутниковые снимки, как правило, являются специалистами, которых либо трудно найти, либо они не заинтересованы в утомительной работе, такой как маркировка данных. Итак, получение большей достоверности - не очень практичный метод. Один из вариантов решения этой проблемы - использовать общедоступный набор данных, если вы можете найти тот, который достаточно близок к вашей проблеме. Если это не так, возможно, вам придется изменить свой подход с обучения с учителем на обучение без учителя или частично с учителем.

Заключение

Работа со спутниковыми изображениями сильно отличается от обычных изображений из-за метода сбора данных, типов датчиков, значения информации и количества данных. Чтобы эффективно использовать спутниковые изображения, специалисты по обработке данных должны понимать эти различия, чтобы они могли выбрать правильный подход к анализу, пониманию и моделированию данных для решения своих проблем.