Мониторинг окружающей среды: необходим, недостаточен, иногда проблематичен

Большой разрыв между доступностью и использованием данных.

Это второе эссе из серии, посвященной перспективам и проблемам использования искусственного интеллекта и машинного обучения для создания планетарной системы экологического менеджмента.

Спасибо моим уважаемым рецензентам, комментаторам и соавторам: Адиа Бей, Орели Шапиро, Азалия Камелия, Боб Лалас, Дэн Моррис, Дебора Пигнатари Друкер, Диана Энтони, Эрик Линдквист, Грегуар Дюбуа, Холли Гримм, Карен Бакенкер, Карин Бакенер. -Беттман, Йоханна Прюссманн, Майра Милкович, Нассер Ольверо, Николас Клинтон, Софи Галлоуэй, Таня Берч и Тайлер Эриксон.

Когда я думаю о глобальной системе экологического менеджмента, я сразу же вспоминаю экологический мониторинг. Как гласит старая пословица, нельзя управлять тем, что нельзя измерить, поэтому любой системе управления нужны способы отслеживания того, чем управляют.

Однако слишком часто разговор о ясном и информативном мониторинге сводится к утверждениям о том, как сам процесс мониторинга и предоставления данных приведет к действию. Теория гласит, что незаконные рубки существуют отчасти потому, что трудно узнать, где и когда они происходят. Точно так же перелов происходит потому, что власти уполномочены обеспечивать соблюдение правил рыболовства, а группы наблюдения, которые сообщают о незаконной деятельности, не могут быстро увидеть, где и когда эти правила нарушаются.

Слишком часто разговор о ясном и информативном мониторинге сводится к утверждениям о том, как сам процесс мониторинга и предоставления данных приведет к действию.

Многие порталы данных называют эту общедоступность данных экологического мониторинга прозрачностью. Например, статья Global Forest Watch Как GFW вносит изменения? В разделе говорится: большая прозрачность помогает общественности требовать от правительств и компаний ответственности за то, как их решения влияют на леса. Веб-сайт GFW открывается словами Global Fishing Watch способствует устойчивости океана за счет большей прозрачности.

Наборы данных, лежащие в основе этих и других порталов, таких как Карта природы Земли и Лаборатория биоразнообразия ООН или инициатива Рука об руку Продовольственной и сельскохозяйственной организации Объединенных Наций, призваны предоставить важную информацию, необходимую для понимания окружающей среды. Однако, когда дело доходит до управления окружающей средой, наборов данных и мониторинг, который их производит, - насколько бы они ни были необходимы - недостаточны для стимулирования действий. Между доступностью данных и их использованием существует большой разрыв.

Что я имею в виду под «прозрачностью» и почему это важно

Начнем с определений, потому что, когда речь идет об экологических данных, прозрачность может означать многое.

Здесь я использую общий термин «прозрачность», чтобы означать «пролить свет на показатели, которые ранее были скрыты или трудно увидеть». Каждый из упомянутых выше порталов данных и наборы данных, которые они составляют, делают ранее скрытые изменения в нашей среде общедоступными. Я называю это «прозрачностью данных» - использование данных для публичного освещения. Прозрачность также может относиться к процессам, используемым для генерации этих данных, и к механизмам обмена данными. Такого рода прозрачность, которую я назову «прозрачностью процесса», может быть достигнута путем публикации алгоритмов и рабочих процессов или, что еще лучше, путем создания кода, реализующего их, доступным, хорошо документированным, легко изменяемым и открытым исходным кодом. Также существует «прозрачность действий», которая позволяет понять, какие действия и кем предпринимаются. Такая прозрачность будет обсуждаться в следующих публикациях.

Наконец, когда я говорю о прозрачности, я имею в виду прозрачность в самом широком смысле. Совершенная всеобщая прозрачность невозможна, потому что не все на Земле имеют одинаковый доступ к информации. Прозрачность можно рассматривать как меру того, сколько людей имеет доступ к информации, а максимальная прозрачность увеличивает это число до максимума.

Как бы сложно и важно ни было, предоставление прозрачных данных, как правило, является лишь первым шагом к достижению положительных экологических результатов. Данные не ведут напрямую к действию.

Прежде чем приступить к рассмотрению ограничений и проблем с прозрачностью, позвольте мне также объяснить, почему это необходимо для глобальной системы экологического менеджмента.

Во-первых, любая такая система будет полагаться на бесчисленное количество поставщиков данных и потерпит неудачу, если эти поставщики и люди, использующие их данные, не будут уверены, что данные точны (в пределах заявленной степени точности). Это означает, что данные должны быть доступны для просмотра и что процессы, используемые для создания этих данных, поддаются проверке, поэтому прозрачность данных и процессов имеет решающее значение для надежности системы.

Учитывая количество авторов данных, будет создано несколько наборов данных с одинаковыми целями. Например, здоровье биоразнообразия можно измерить разными способами, в том числе с помощью Индекса живой планеты Всемирного фонда дикой природы / Лондонского зоологического общества, Индекса нетронутости биоразнообразия или Карты природы. данные о видовом богатстве. Эти наборы данных должны быть каким-то образом сопоставимы, и прозрачность того, что это за данные и как они были получены, имеет решающее значение для проведения этих сравнений. Более того, также важно признание его допущений и недостатков, например: глобальные индексы обычно не отражают неоднородность распределения биоразнообразия и часто приводят к грубым результатам, которые необходимо хорошо информировать, чтобы обеспечить правильную интерпретацию.

В связи с двумя предыдущими пунктами глобальная система должна допускать широкое сообщество сотрудников. Организации и сообщества, желающие включить свои собственные данные или использовать данные из глобальной системы, должны будут понимать, как взаимодействовать с системой.

Далее, любая система управления должна отслеживать изменения с течением времени, а доступность данных и методологий для их создания помогает обеспечить возможность долгосрочной непрерывной отчетности о показателях, если средства для сбора входных данных используются для создания доступны наборы данных.

Наконец, что наиболее важно, если наборы данных не будут широко доступны, они не будут использоваться и не смогут помочь с глобальной системой управления, которая поддерживает максимально широкую аудиторию.

Прозрачные экологические данные дали очевидные преимущества. GFW, например, сообщает, что их платформа использовалась правительствами Мексики, Индонезии и Демократической Республики Конго для информирования государственной политики. Кроме того, правозащитные организации использовали GFW для стимулирования принудительных действий против незаконных рубок. GFW также сообщил об использовании этого инструмента правительствами, включая Гану и Индонезию, для поддержки правоохранительных органов.

Прозрачность данных не всегда возможна или хороша

Но, несмотря на известное изречение Стюарда Брэнда о том, что информация хочет быть бесплатной, прозрачность данных не всегда воспринимается как выгодная или даже возможная с юридической точки зрения:

  • Во многих случаях обмен информацией является незаконным или ограничен определенными способами, например, в Общем регламенте защиты данных Европы. В частности, обмен геопространственной информацией ограничен многими правительствами (см., Например, политику в отношении геопространственных данных Индии и Малайзии).
  • Иногда законы, требующие совместного использования данных, могут отрицательно сказаться на положительных результатах, например, недавно отмененное правило в Соединенных Штатах, согласно которому EPA может использовать только прозрачные данные в своих оценках.
  • Корпорации и суверенные государства также осторожно относятся к совместному использованию природных данных, которые могут быть использованы корпорациями или другими странами - как, например, в случае ограничений Бразилии на обмен биологическими данными. Фактически, существует большое движение за естественную репатриацию данных, в котором страны и сообщества пытаются вернуть свои данные. Дискуссию о затратах и ​​преимуществах прозрачности можно увидеть в обсуждениях, сравнивающих принципы СПРАВЕДЛИВОСТИ (данные должны быть f неизменными, a доступными, i nteroperable и r eusable) и принципами CARE для управления данными коренных народов (c коллективная выгода, возможность контроля, r ответственность и e thics). Подробнее об этих двух наборах принципов данных мы поговорим в следующих статьях.
  • Обмен данными о местонахождении ценных ресурсов, таких как полезные ископаемые, ценная древесина или находящиеся под угрозой исчезновения дикие животные, может открыть для них новые угрозы.

Любая платформа, обеспечивающая прозрачность данных, должна учитывать риски обмена данными и предоставлять средства для снижения этих рисков. Пределы прозрачности часто можно преодолеть с помощью нескольких механизмов. Во-первых, данные могут быть анонимными, и существует обширная литература и множество инструментов, позволяющих анонимизировать данные (и почему это не так просто, как вы думаете). Еще один инструмент - агрегирование данных, при котором используются обобщенные, а не необработанные данные. Наконец, как это иногда бывает с уязвимыми видами, на данные может быть наложено эмбарго, т. Е. Они будут выпущены только после того, как время снизит риски обмена данными.

Даже когда это возможно, прозрачности недостаточно

Как бы сложно и важно ни было, предоставление прозрачных данных, как правило, является лишь первым шагом к достижению положительных экологических результатов. Данные не ведут напрямую к действию. Для этого есть много причин, в том числе проблемы с переводом, информационная перегрузка, паралич анализа, нехватка ресурсов, неспособность принять во внимание местный контекст и, в некоторых случаях, коррупция. Ниже вы найдете некоторые из наиболее распространенных препятствий на пути использования только прозрачности данных для улучшения планеты:

Необработанные данные часто бесполезны для лиц, принимающих решения. Первый разрыв между данными и действием возникает из-за необработанных форм, в которых поступают данные. Во многих случаях лица, принимающие решения, которые могут повлиять на позитивные изменения окружающей среды, не могут использовать данные в необработанном виде. Например, корпорации, пытающиеся снизить риски в своей цепочке поставок, хотели бы просто знать, кто из их поставщиков занимается заготовкой товаров неустойчиво. Глобальная карта пикселей обезлесения не дает им необходимой информации. (Команда GFW осознала это и создала Global Forest Watch Pro для решения именно этой проблемы.)

Иногда информация должна поступать в определенной форме, например, отчеты полиции для правоохранительных органов или документы о раскрытии информации для банков. Бразильская организация Terras делает шаг в этом направлении, создав программное обеспечение, которое использует большие данные и анализ окружающей среды на основе машинного обучения, чтобы помочь владельцам сельской собственности определить, соответствует ли их собственность критериям социально-экологической ответственности кредитных организаций. Данные, собранные с использованием больших данных и машинного обучения, часто недопустимы в суде. Прозрачность может стать неэффективной из-за несоответствия регулирования.

Данные часто выделяют слишком много параметров и не отдают приоритет ни одному из них. Вторая проблема с прозрачностью возникает в ситуациях, когда в данных просто выделяется слишком много вариантов. В контексте незаконной потери лесов спутниковые снимки могут показать так много мест, где происходит потеря лесов, что трудно понять, как решить эту проблему. В этих случаях прозрачность должна сопровождаться установлением приоритетов, что дает возможность для большей прозрачности - в частности, прозрачности в том, как расставляются приоритеты.

Данные необходимо преобразовать в смысл. Следующие проблемы с прозрачностью связаны с приданием смысла данным. Существует цепочка создания стоимости, переходящая от данных к информации, от понимания к действию - и движение по этой цепочке требует знания доступных типов обработки и средств выполнения этой обработки. На каждом этапе можно применять дополнительную прозрачность. И даже тем, кто обладает такими знаниями, может по-прежнему не хватать ресурсов для доступа и преобразования данных в полезную информацию - человеческих ресурсов для выполнения работы, вычислительных ресурсов для обработки информации в разумные сроки или финансовых ресурсов для оплаты людей и инфраструктуры.

Обычно существует несоответствие между масштабом данных и масштабом, при котором требуется понимание. В области охраны природы и наблюдения за Землей машинное обучение и искусственный интеллект чаще всего применяются к грубым данным и на обширных территориях. Машинное обучение дает наилучшие результаты при загрузке больших объемов данных, а бесплатные спутниковые снимки являются идеальным источником для этих данных. Однако глобальные исследования на основе свободно доступных данных часто дают результаты, которые не соответствуют потребностям в более локализованном контексте. Одним из примеров этого является отличный набор данных о доступности поверхностных вод, созданный Совместным исследовательским центром Европейской комиссии. Набор данных прекрасно справляется с задачей представления глобальной перспективы наличия поверхностных вод в течение длительного периода времени. Однако, будучи глобальной картой, она может не соответствовать потребностям местного масштаба. Например, было показано, что он недостаточно представляет поверхностные воды в бразильском Пантанале. Для того, чтобы быть полезной для локальных контекстов, критически важны дополнительная информация, возможность интеграции локальных и глобальных данных и возможность подгонки алгоритмов к локальным контекстам.

Дейта нелегко побороть намеренное незнание и коррупцию… пока. Наконец, давайте посмотрим правде в глаза: все данные в мире не помогут, когда люди, принимающие решения, игнорируют их или намеренно неверно истолковывают. Однако в этом может помочь прозрачность в принятии решений. И исследования использования больших данных и машинного обучения для обнаружения коррупции начинают набирать обороты.

Итог: Прозрачность - основа глобальной системы экологического менеджмента. Но этого ни в коем случае недостаточно для успеха, или этого легко добиться.

От прозрачности к объяснимости

Выше я говорил о прозрачности данных и прозрачности процессов. Во всех наборах данных, которые я обсуждал, использовался искусственный интеллект для извлечения информации с многочисленных датчиков, в первую очередь со спутников наблюдения Земли. Хотя платформы, которые я описал, хорошо делают данные общедоступными, процессы, используемые для генерации этих данных, могут быть непрозрачными. Действительно, отсутствие прозрачности в решениях искусственного интеллекта было одной из самых распространенных ловушек ИИ.

Например, самые ранние решения искусственного интеллекта в здравоохранении были частично отвергнуты, потому что, хотя системы делали правильные прогнозы, им было трудно обосновать свои решения. Фактически, это непонимание отражает отсутствие прозрачности - неспособность объяснить, почему система ИИ ведет себя именно так.

Фактически, в системах ИИ существует два типа прозрачности: интерпретируемость и объяснимость. Система искусственного интеллекта с высокой степенью интерпретируемости ведет себя понятным для человека образом. Имея набор входных данных, люди могут интерпретировать, как система ИИ пришла к достижению заданного результата. С другой стороны, объяснимость более детальна. объяснимая система ИИ - это система, в которой можно выяснить внутренние механизмы ИИ.

Понимание этих тем в контексте системы экологического менеджмента важно, потому что, если люди не доверяют системе, она не будет принята. В следующем посте я более подробно расскажу об объяснимости и интерпретируемости систем ИИ, а также о том, насколько они важны для глобальной системы управления окружающей средой.

Прочтите предыдущее эссе из серии: G.AI.A: Искусственный интеллект и управление окружающей средой в планетарном масштабе