АВТОРСКИЙ ВИДЕО

Устали проигрывать в настольных играх? Если вы специалист по анализу данных, вам и не нужно.

Чему мы можем научиться, моделируя огромное количество ходов в монополии, игры в крестики-нолики и броски кубиков по желобам и лестницам?

В серии «Обзор авторов» редакторы TDS беседуют с членами нашего сообщества о своем карьерном росте в области науки о данных, написании статей и источниках вдохновения. Сегодня мы рады поделиться нашей беседой с Джейком Митчеллом.

Джейк - специалист по машиностроению, интересующийся наукой о данных. В свободное время любит моделировать настольные игры и заниматься спортивной аналитикой. Недавно мы связались с ним, чтобы поговорить о его популярной серии статей о настольных играх, статистике и других темах.

Что вас как студента инженерного факультета привлекло в науке о данных?

Мое путешествие по науке о данных началось в младшем классе средней школы, когда появился новый класс по информатике. То, что я думал, будет просто лишним флажком в моих заявлениях в колледж, превратилось в настоящую страсть после того, как я быстро увидел преимущества и полезность кодирования.

Примерно в это же время я обнаружил веб-сайт FiveThirtyEight. Они используют данные и статистический анализ для написания статей о спорте и политике, но их серия под названием Риддлер меня очень заинтриговала. Загадочник рассылает задачи каждую неделю, для ответа на которые в большинстве случаев требуется кодирование. Я проверил свои недавно обретенные навыки работы с данными и решал еженедельные загадки для развлечения, а также узнал больше о кодировании. Эти загадки показали мне, как кодирование можно применить практически ко всему, что позже послужило поводом для моих статей о науке о данных.

Какие проекты, ориентированные на данные, вам больше всего нравятся?

Области науки о данных, которые мне кажутся более интересными, требуют моделирования. Поскольку у меня есть опыт в математике и статистике, мне нравится находить ответы на вопросы, для которых нет определенной формулы. Не существует формулы для шансов на победу в монополии, как есть для результатов подбрасывания монеты 10 раз. На мой взгляд, эти задачи, требующие моделирования из-за своей сложности, дают наиболее удовлетворительные результаты, и, вероятно, поэтому я считаю их наиболее интересными.

Откуда взялась идея вашей серии по науке о данных и настольным играм?

Моя идея объединить науку о данных с настольными играми возникла после того, как мои младшие братья и сестры слишком много раз терпели поражение в «Монополии». Это было за много лет до того, как я задумал написать о своих проектах, поэтому моей главной целью было использовать науку о данных, чтобы выиграть больше настольных игр против моей семьи. Перенесемся на 4–5 лет вперед, и я проигрываю своим соседям по комнате в Катане. Только не это снова.

Я решил открыть MATLAB и снова начал замышлять свою месть. Результаты оказались действительно интересными, и я начал задаваться вопросом, будут ли все эти результаты интересны и другим людям. Наконец, родилась моя серия по науке о данных и настольных играх.

Как вы подходили к планированию этой серии?

Когда я разрабатывал эти проекты, я хотел, чтобы люди с любым опытом могли наслаждаться результатами и использовать их в следующий вечер игры. Есть люди, которым действительно нравится видеть код, стоящий за проектами, поэтому я обязательно включаю часть своего кода с пояснениями. Есть те, кто хочет видеть множество графиков и цифр, представляющих данные (я один из них), поэтому я также обязательно представляю свои выводы графически. Я также хотел, чтобы те, у кого не было опыта в математике или статистике, могли извлечь что-то из этих статей, поэтому я обязательно резюмирую все в простых для понимания терминах в конце.

Какие выводы из этого проекта были для вас самыми неожиданными?

При создании этой серии меня очень удивили несколько вещей. Во-первых, определенно должно быть то, насколько в кажущихся случайными играх есть эти действительно интересные закономерности. Игры с броском костей кажутся случайными, если смотреть на объем одной игры, но расширяют это до 50 000 игр и обнаруживают некоторые важные преимущества. Мне очень приятно взять игру, которая включает, по сути, генератор случайных чисел, и превратить ее в статью, которая показывает, как даже самые простые и случайные игры имеют преимущества, в которые можно играть.

Второй вывод должен заключаться в том, какой интерес вызвала эта серия. Когда я впервые опубликовал статью о настольной игре, я подумал, что могу получить несколько мнений от тех немногих людей, которые также думали, что это отличная идея. Чего я не ожидал, так это того количества интереса и отзывов, которые я получил за последний месяц. Значительное количество людей, которым искренне нравится читать эту серию, действительно подтолкнуло меня к поиску новых настольных игр, о которых можно было бы писать.

Обнаружили ли вы какие-либо связи между этой серией - которая кажется забавным побочным проектом - и другими вашими интересами в области науки о данных и инженерии?

Связь между настольными играми и инженерией поначалу может показаться туманной, но есть много моментов, которые следует учитывать, исходя из моего опыта создания этой серии. Инженеры - профессиональные решатели проблем, и преобразовать сложную настольную игру в алгоритм, понятный компьютеру, - огромная проблема. Я уже убедился, что преимущества кодирования окупаются, будь то конструкция машины (случайное моделирование компонентов вала для поиска оптимальной конструкции) или робототехника (прогнозирование углов двигателя для конечностей робота). Хотя знания, полученные в плане преимуществ настольных игр, могут не иметь большого значения для других моих интересов в области науки о данных или инженерии, опыт и навыки решения проблем, полученные на этом пути, бесценны.

Говоря о вашей работе и других проектах, что вас ждет дальше?

Я поступаю на последний год обучения по программе машиностроения и начинаю понимать, чем хочу заниматься после окончания учебы. Я попытаюсь сосредоточиться на робототехнике в надежде использовать свой опыт в области науки о данных в этой области. Что касается публичного письма, я буду продолжать писать о своих побочных проектах, будь то моя существующая серия или новая. Я воодушевлен тем, что ожидает меня в будущем с моими статьями, и надеюсь, что мои подписчики на Medium и Towards Data Science продолжат расти.

Будьте в курсе последних работ Джейка, подписавшись на него в Medium и LinkedIn - и, если вы еще не читали их, вот некоторые из его последних сообщений TDS по различным темам, от настольных игр до Disney World: