Netflix - не только одно из самых узнаваемых имен в мире, но и одно из самых узнаваемых имен в области науки о данных, и доктор Бекки Такер, специалист по данным в Netflix, слишком хорошо знает о силе данных и их возможностях. скажи нам. Будь то рекомендации для нашей следующей большой запой или то, как люди, скорее всего, отреагируют на кризис, данные являются одним из самых ценных инструментов, доступных при разработке стратегии, принятии решений и расшифровке ваш следующий ход.

В такие времена неопределенность и нестабильность повсюду. Кажется, что страх, беспокойство и отчаяние взяли верх, а рациональности и здравого смысла нигде нет. Но именно здесь на помощь приходят данные. Чему мы можем научиться в этих нестабильных средах и как мы можем двигаться в соответствии с тем, что говорят нам эти модели данных?

«Модели - это абстракция мира, которая, как мы надеемся, сообщает нам что-то полезное. Это может быть предсказание или вывод о том, как, по нашему мнению, устроен мир », - объясняет д-р Такер. Именно здесь вступает в игру важность окружающей среды. «Если ваша модель представляет собой абстракцию проблемы реального мира, тогда ваша модель хороша ровно настолько, насколько хороши данные, которые вы можете в нее вложить».

Данные создаются непосредственно окружающей средой, поэтому при работе с нестабильными обстоятельствами, такими как COVID-19, крайне важно, чтобы мы сначала обнаружили и распознали эту нестабильность, а затем глубже изучили наши наборы для обучения и тестирования, чтобы убедиться, что ничего не пропало.

Но это не значит, что мы по-прежнему не увидим необычных результатов или сдвигов.

«Карантин влияет на все данные, будь то данные розничной торговли, данные о трафике или данные бакалейных магазинов (например, туалетная бумага). Даже изменения в поведении дома, рост Netflix (подмигивание, подмигивание), увеличение количества домашних тренажеров и фитнеса. Эти сдвиги являются прямым результатом текущей среды, в которой находятся люди, и отражением действий, которые они сейчас предпринимают из-за нее.

Мы не можем видеть будущее или предсказывать что-то беспрецедентное, но данные могут выявить пробелы и помочь нам выявить эти пробелы и использовать их выводы в наших интересах. Роль знания предметной области становится все более важной, особенно в нестабильных средах, потому что вашей конечной целью является создание абстракции.

Знание, где можно срезать путь, а где нельзя, в конечном итоге определит качество полученных вами данных и поможет лучше всего спрогнозировать следующий шаг в эти продолжающиеся времена неопределенности.

Слушайте полный подкаст о том, как стать современным специалистом по обработке данных в Netflix с доктором Бекки Такер, а также другие выпуски Data Science in 30 Minutes, здесь.

Эта статья основана на недавнем подкасте Data Science за 30 минут о Modern Data Scientist в Netflix. Послушай здесь.

Кали Фрисби, Pragmatic Institute

Оригинальный пост здесь.

Прочтите больше статей по науке о данных на OpenDataScience.com, включая учебные пособия и руководства от новичка до продвинутого уровня! Подпишитесь на нашу еженедельную рассылку здесь и получайте последние новости каждый четверг. Вы также можете пройти обучение по науке о данных по запросу, где бы вы ни находились, с нашей платформой Ai + Training.