Эпистемический статус/мотивация. Одно из моих заданий в рамках курсовой работы — Тезис за 3 минуты (3МТ). Это его расширенная версия. Поскольку мне всего несколько месяцев, я и никто другой в мире, даже мои руководители, на 100% уверены в том, чем я буду заниматься в ближайшие годы (надеюсь, не больше). Таким образом, когда я пишу о будущем моей диссертации, я недостаточно квалифицирован и слишком самоуверен.

TLDR: алгоритмы зависят от типа данных, т. е. алгоритмы, которые работают с изображениями, не работают со звуками. На сегодняшний день у нас нет хорошего алгоритма для обработки пространственно-временных данных. Мой докторский проект должен сделать один.

Машинное обучение, название которого гораздо лучше подходит для замены искусственного интеллекта, заключается в прогнозировании (грубое упрощение). Если вы дадите ему фотографию, он скажет вам, что это кошка.

Если вы дадите ему предложение, оно переведет его на другой язык. Если вы дадите ему звукозапись, он может расшифровать ее для вас (распознавание речи как тот, который использует Google) или даже сказать вам вид лягушки, производящей звук.

Если вы дадите ему исторические данные временного ряда, он будет предсказывать будущее. Неважно, будет ли это цена фондового индекса, глобальная температура моря или любые другие экономические или климатические данные, он сделает свою работу.

Однако не все типы данных одинаковы. Например, самым крупным прорывом в машинном обучении, возможно, является изобретение Сверточной нейронной сети (CNN) в 1989 году Яном ЛеКуном (который в настоящее время работает главным ученым по искусственному интеллекту в Facebook) и другими. CNN очень хорошо работает с изображениями и подобными изображениям данными. Фактически, он настолько успешен, что даже сегодня, 30 лет спустя, мы все еще используем варианты CNN всякий раз, когда имеем дело с изображениями.

К сожалению, CNN плохо работает с другими типами данных.

Следующим большим прорывом стало изобретение долговременной кратковременной памяти (LSTM) в 1997 году. LSTM очень хорошо работает с последовательными данными. Думайте о письменных языках как о последовательности символов или слов. И звук как последовательность высот с разной громкостью. Временной ряд — это в основном последовательность значений, изменяющихся во времени. Опять же, LSTM плохо работает с непоследовательными данными.

Сегодня у нас есть новый тип данных, и это пространственно-временные данные об объектах, движущихся в пространстве. Наши предыдущие алгоритмы плохо работают с такими данными. Моя диссертация посвящена разработке нового алгоритма, который хорошо работает с пространственно-временными данными.

И важно, что такой алгоритм выстроен. Вот 6 примеров его применения:

Прогноз трафика. Пространство — ограниченный ресурс. Нам нужно выделить место для транспортировки, и нам нужно оптимизировать эти ресурсы. Пространственно-временные данные включают в себя движение транспортных средств, а также их пассажиров и грузов. Создание лучших моделей прогнозирования трафика означает, что мы можем лучше понять и более эффективно использовать транспортную сеть.

Прогнозирование траектории. Важно уметь предсказывать, куда движутся люди и другие объекты. Владельцам бизнеса интересно знать, где лучше всего разместить свои магазины и рекламу. Ваш личный цифровой помощник будет почти бесполезен, если он не сможет выполнить эту задачу. Самоуправляемые автомобили должны предсказывать траекторию других автомобилей, а также пешеходов, чтобы избежать столкновений.

Прогноз задержки рейса. Это очень просто, и это также один из проектов, в которых я лично участвую в настоящее время, благодаря Northrop Grumman.

Обнаружение аномалий. Пространственно-временные данные — это больше, чем просто деньги и удобство. Если мы будем использовать все доступные данные, мы сможем выявлять преступления и несчастные случаи сразу же, как только они происходят, или даже за несколько мгновений до этого. Таким образом, мы могли бы отправить полицию и экстренные службы на несколько минут раньше по всему миру, потенциально спасая много жизней.

Распознавание действий. Не ограничивайте пространственно-временные данные только людьми и транспортными средствами, речь идет о любых движущихся в пространстве объектах. Одна группа использует его для наблюдения за пациентами в реабилитационном центре, чтобы убедиться, что они правильно выполняют свою рутину. Это лишь одно из следствий пространственно-временных данных в области медицины.

Миграция животных. Для нас также важно понять закономерности и факторы, влияющие на миграцию животных. Это имеет экологические последствия, а также усилия по сохранению.

Это то, чем я планирую заниматься в ближайшие 3 года.