Эта запись в блоге является третьей в серии интервью с учеными и новаторами, работающими на стыке машинного обучения и экологической устойчивости. Поскольку технологические инновации продолжают проникать в новые отрасли, крайне важно, чтобы приложения в экологическом секторе были в приоритете. Мы можем убедиться, что эти пути созданы, углубившись в истории, стоящие за званием специалиста по данным. Эта серия блогов призвана расширить признание способности науки о данных показать, как мы решаем сложные экологические проблемы, имеющие значение.

Международный институт устойчивого развития (МИУР) — некоммерческая организация со штаб-квартирой в Виннипеге, Канада. Их международная команда многопрофильных экспертов предоставляет знания для действий. IISD решает некоторые из самых насущных мировых проблем, проводя инновационные исследования, собирая доказательства и отстаивая устойчивые решения. Джеффри Ганн — политический советник отдела водных ресурсов IISD, помогающий государственным и частным организациям превращать данные об окружающей среде в более разумные решения.

Чем занимается Международный институт устойчивого развития?

Мы работаем с правительствами на всех уровнях, чтобы построить более устойчивый мир, привнося фактические данные и данные в политический процесс. Это включает в себя поддержку усилий по достижению Целей в области устойчивого развития, разработку планов по адаптации к изменяющемуся климату и повышение устойчивости сообщества на справедливой и равноправной основе.

Нам выпала честь управлять Экспериментальной зоной озер IISD (IISD-ELA): естественной лабораторией, состоящей из 58 озер и их водоразделов на северо-западе Онтарио, Канада. Исследователи на объекте проводят настоящие эксперименты на этих озерах с 1968 года, в течение этого времени они также собирали данные о водных экосистемах этого малонаселенного региона, практически не затронутого деятельностью человека. Теперь мы видим, как эти данные и наука могут быть использованы для информирования политики.

Что делает вашу работу уникальной?

Мы управляем одним из немногих мест на Земле, где ученые могут манипулировать и наблюдать за изменениями в реальных озерах. Наш объект представляет собой смесь искусственных озер, в которые ученые внесли преднамеренные изменения, и эталонных озер, оставленных в их естественном состоянии. Это дает нам четкое представление о том, как озера реагируют на антропогенные и природные нарушения, а также об их способности восстанавливаться. Наши эксперименты варьируются от моделирования воздействия внезапных изменений, таких как разлив химикатов, до более тонких, хронических воздействий сельскохозяйственных и муниципальных загрязнителей и изменения климата на естественные экосистемы.

Как наука о данных помогает решить эти проблемы?

В последние годы и благодаря поддержке Фонда РБК мы начали уделять особое внимание тому, как наука о данных, машинное обучение и искусственный интеллект изменят то, как мы ведем бизнес. Нам нужно иметь более четкое представление о том, что нас ждет. Суть науки в том, чтобы лучше предсказывать будущее, что означает иметь доказательства текущих и прошлых изменений, а затем экстраполировать то, что может произойти в будущем.

Ключевой особенностью науки о данных является «ориентация на решения». Как новые или существующие потоки данных могут привести к бизнес-решениям? Мы хотим найти реальные решения реальных проблем, используя самые лучшие данные. Существует множество инструментов науки о данных, которые можно использовать для лучшего понимания окружающей среды и построения общества, работающего в гармонии с природой, а не против нее.

Мы очарованы перспективой использования классификации и кластеризации озер отпечатков пальцев (во времени и пространстве), чтобы понять, как физические параметры влияют на пищевые сети. Мы также изучаем, как некоторые методы работы с большими данными могут открыть еще больше научных данных из наших исторических данных.

Благодаря IISD-ELA у вас достаточно данных для работы. С какими проблемами вы сталкиваетесь при сборе данных и управлении ими?

У нас есть данные по 58 озерам, собранные 1500–2000 учеными и студентами за 52 года. Это МНОГО данных, но мы собираем их сами и в течение длительного периода времени, что создает свой собственный набор уникальных проблем. Мы занимаемся сложными аспектами управления данными и работаем над тем, чтобы сделать их доступными для ученых по всему миру, в том числе для специалистов по данным.

Длинный исторический набор данных требует значительных методов очистки, унификации и документирования, чтобы сделать его машиночитаемым. Многие из наших долгосрочных методов сбора данных выполняются так же, как и в 1970-х годах, поэтому мы по-прежнему используем ноутбуки и тратим много времени на улучшение машиночитаемости данных. Так обстоит дело с нашей программой Долгосрочные экологические исследования, которая содержит гигабайты собранных вручную метеорологических, гидрологических данных, данных о качестве воды и рыболовстве, начиная с 1968 года. Мы движемся к использованию программного обеспечения и сотовых телефонов для оцифровки данных прямо с Начало. Как вы понимаете, это значительно улучшает проверку, поскольку мы находим ошибки сразу, а не через полгода.

Наш метеосайт — еще один хороший пример. Это отличный сайт для калибровки исторических данных, но у нас есть несколько методов сбора данных о температуре (включая использование как ртутных, так и цифровых термометров), что требует много работы для персонала. Сейчас мы изучаем, как высокочастотные цифровые датчики в озерах могут моделировать физические параметры и экономить время в будущем. Для этого потребуются годы повторного отбора проб, но это ценность, которую мы можем предоставить ученым-водникам.

COVID-19 сделает этот год вызовом. Мы все сталкиваемся с проблемами физического дистанцирования и изоляции, и мы признаем, что полевые ученые во всем мире ставят наше общее здоровье выше своей работы. В этом сезоне мы видим, как мы можем свести к минимуму пробелы в наборе данных и методах тестирования, которые сообщают нам о состоянии окружающей среды, не подвергая риску чье-либо здоровье. Это может означать, что наш операционный персонал — преданные своему делу люди, которые живут на месте и обеспечивают работу предприятия, — будет проводить больше отборов проб, чтобы сократить количество выездов за пределы предприятия. К сожалению, это означает, что многие студенты, от начальных до аспирантов, не смогут посещать полевые курсы или работать на сайте.

Как цифровизация изменит вашу работу?

Один из вопросов, над которым мы бьемся, заключается в том, как мы, как глобальное общество, имеем так много данных — больше, чем когда-либо раньше, — и все же чувствуем, что недостаточно знаем о нашей среде? Оцифровка данных с помощью автоматических датчиков и подключения к Интернету может изменить масштабы мониторинга озер и уменьшить количество проблем, связанных с обеспечением качества. Многие из интересующих нас озер довольно удалены, и доступ к ним возможен только раз в месяц или раз в год. Недорогие датчики, которые позволяют нам ежедневно брать пробы, дадут нам совершенно новый взгляд на то, как ведет себя окружающая среда.

Как вы подошли к проблеме обмена данными и обеспечения более широкого доступа для специалистов по данным?

Одна вещь, в которой мы добились успеха, — это работа с программой DataStream Фонда Гордона, которая представляет собой онлайн-платформу для обмена данными о воде. Любой, кто занимается мониторингом, может загружать свои данные, создавать визуализации и делиться своими выводами. Это создало стандарт для обмена данными о качестве воды по всей стране — от ученых-добровольцев до профессиональных государственных организаций. Платформа устанавливает процесс и общий язык, с которым все могут согласиться и продолжать развиваться.

Где вы видите возможности использования новых данных и алгоритмов для продвижения своей работы?

Мы рады видеть, что компьютерное зрение может предложить областям биологии и экологии. Прошлым летом наша команда разработала концептуальный способ прогнозирования потока инвазивных видов в нашей провинции с помощью дорожных камер для обнаружения рыбацких лодок с прицепом. Мы также начали сотрудничество с другими учеными, использующими компьютерное зрение, чтобы быстро понять, как химические вещества влияют на развитие эмбрионов рыб.

Я очень взволнован тем, что «соберу все это вместе». Сейчас задача состоит в том, чтобы соединить все данные, которые у нас есть из нескольких источников, чтобы получить всестороннее представление о состоянии окружающей среды. Как нам связать данные со спутников, которые постоянно находятся на орбите, но их трудно использовать и требуют калибровки, с данными профессиональных ученых по графикам мониторинга или краткосрочными грантами, с данными, собранными гражданскими учеными? Крайне важно, чтобы мы налаживали более тесное сотрудничество с дисциплинами, имеющими более долгую историю в космосе, такими как метеорология и океанография. Не менее важно создавать команды с разнообразными способностями.

Какими уроками вы можете поделиться с точки зрения государственной политики?

Важно создать сообщество практиков. Мы разрабатываем семинары с представителями некоммерческих организаций и государственного сектора, заинтересованными в мониторинге качества воды. Речь идет о том, чтобы показать, что работает, как вы это делаете, а затем создать сообщество, которое общается и отчитывается. Это действительно путь перехода от науки к политике.

Использование инструментов визуализации, таких как PowerBI, упростило общение внутри компании и с политиками. Отчетность о прогрессе таким образом, чтобы лица, принимающие решения, могли получать данные в режиме реального времени и в важном для них масштабе, невероятно полезна.

Что необходимо, чтобы больше специалистов по обработке и анализу данных заинтересовались работой в этой области?

Местность действительно имеет значение! Глобальные изменения важны, но часто они носят диффузный характер. Важно, чтобы ученые данных работали над проблемами, которые действительно меняют жизнь на местном уровне. Есть много желающих делать добро, и создание платформ, в которых специалисты по данным могут участвовать на местном уровне, имеет решающее значение. У нас есть конкурс Аквахакинг, который призывает предпринимателей и студентов объединиться для решения проблем с пресной водой. Я думаю, что если студенты потратят несколько лет на изучение окружающей среды, они по-новому оценят сложность данных, с которыми мы работаем.