Забудьте смотреть в телескоп на звезды. Астроном сегодня, скорее всего, будет онлайн: планирует наблюдения в цифровом виде, запускает их удаленно на телескопе в пустыне и загружает результаты для анализа.

Для многих астрономов первым шагом в науке является компьютерное исследование этих данных. Это может звучать как модное слово, но наука, основанная на данных, является частью глубокого сдвига в таких областях, как астрономия.

Отчет 2015 года Австралийской академии наук показал, что среди более чем 500 профессиональных астрономов в Австралии около четверти их исследовательской деятельности в настоящее время носит вычислительный характер. Тем не менее, многие школьные и университетские предметы науки, технологии и инженерии по-прежнему относятся к необходимым навыкам как к гражданам второго сорта.

Ссылаясь как на моделирование мира с помощью симуляций, так и на изучение данных наблюдений, вычисления занимают центральное место не только в астрономии, но и в целом ряде наук, включая биоинформатику, компьютерную лингвистику и физику элементарных частиц.

Чтобы подготовить следующее поколение, мы должны разработать новые методы обучения, которые признают основанные на данных и вычислительные подходы одними из основных инструментов современных исследований.

Эпоха больших данных в науке

Великие эмпирики 17 века считали, что если мы будем использовать наши чувства для сбора как можно большего количества данных, мы в конечном итоге поймем наш мир.

Хотя эмпирическая наука имеет долгую историю, существуют некоторые ключевые различия между традиционным подходом и наукой, основанной на данных, которой мы занимаемся сегодня.

Изменение, которое, возможно, оказало наибольшее влияние, — это огромное количество данных, которые теперь могут собирать компьютеры. Это позволило изменить философию: данные можно собирать для обслуживания многих проектов, а не только одного, и то, как мы исследуем и извлекаем данные, позволяет нам «планировать интуицию».

Возьмите поиск новых типов астрономических явлений. Большие наборы данных могут давать неожиданные результаты: некоторые современные примеры — открытие быстрых радиовсплесков астрономом Дунканом Лоримером и открытие плазменных трубок в ионосфере Земли моей бывшей студенткой бакалавриата Клео Лои. Оба они зависели от извлечения архивных наборов данных, которые были разработаны для другой цели.

Сейчас многие ученые совместно разрабатывают эксперименты, которые могут служить сразу нескольким проектам и проверять разные гипотезы. Например, книга с изложением научного обоснования будущего телескопа Square Kilometer Array Telescope, который будет построен в Южной Африке и Австралии, состоит из 135 глав, написанных 1200 авторами.

Наша система образования тоже нуждается в изменениях

Классические образы науки включают Альберта Эйнштейна, записывающего уравнения относительности, или Марию Кюри, открывающую радий в своей лаборатории.

Наше понимание того, как работает наука, часто формируется в старшей школе, где мы изучаем теорию и эксперимент. Мы представляем, как эти два столпа работают вместе: ученые-экспериментаторы проверяют теории, а теоретики разрабатывают новые способы объяснения эмпирических результатов.

Вычисления, однако, упоминаются редко, и многие ключевые навыки остаются неразвитыми.

Например, для разработки беспристрастных экспериментов и выбора надежных образцов ученым необходимы отличные статистические навыки. Но часто эта часть математики отходит на второй план в университетских дипломах. Чтобы наши эксперименты и исследования, основанные на данных, были точными, ученым нужно знать больше, чем просто школьную статистику.

На самом деле, чтобы решать проблемы в эту эпоху, ученым также необходимо развивать вычислительное мышление. Речь идет не только о кодировании, хотя это хорошее начало. Им нужно творчески подходить к алгоритмам, а также к тому, как управлять данными и извлекать их с помощью сложных методов, таких как машинное обучение.

Применение простых алгоритмов к массивным наборам данных просто не работает, даже если у вас есть мощность суперкомпьютера с 10 000 ядер. Переход к более сложным методикам из информатики, таким как алгоритм kd-дерева для сопоставления астрономических объектов, может ускорить работу программного обеспечения на порядки.

Некоторые шаги предпринимаются в правильном направлении. Многие университеты вводят курсы и степени в области науки о данных, объединяя статистику и информатику с наукой или бизнесом. Например, недавно я запустил онлайн-курс по астрономии, управляемой данными, целью которого является обучение таким навыкам, как управление данными и машинное обучение в контексте астрономии.

В школах новая Австралийская учебная программа по цифровым технологиям включает программирование и вычислительное мышление в учебную программу со 2-го года обучения. Это будет способствовать развитию жизненно важных навыков, но следующим шагом будет интеграция современных подходов непосредственно в классы естественных наук.

Вычисления уже более полувека являются важной частью науки, а взрыв данных делает их еще более важными. Обучая вычислительному мышлению как части науки, мы можем гарантировать, что наши студенты будут готовы совершить следующий раунд великих открытий.

Тара Мерфи, доцент и будущий научный сотрудник ARC, Университет Сиднея. Эта статья изначально была опубликована на Разговоре. Читать оригинальную статью.