Ленивый специалист по данным

Нет ничего хуже, чем потраченные впустую усилия

Ленивый специалист по обработке данных - это не тот человек в вашей команде, который выполняет наименее полезную работу - скорее всего, это тот человек, чья работа наиболее полезна. Они просто люди, которые больше всего ненавидят, когда усилия тратятся зря.

Работа над неправильной проблемой

Худший вид потраченных впустую усилий - это плодотворные усилия, приложенные к неправильной проблеме - это просто душераздирающе, учитывая, что могло бы быть, если бы усилие было приложено правильно. В некоторых кругах это было названо ошибкой «Типа III» - правильный ответ на неправильный вопрос.

Это область, которой, возможно, не уделялось должного внимания - иногда кажется, что есть предположение, что только на собственном опыте большинство людей в конечном итоге научится искусству определения реальной проблемы, предположительно через несчастный опыт. Однако по определению опыт фактически означает «неоднократно делать неправильный путь, прежде чем наткнуться на верный путь», поэтому обучение самому, вероятно, потребует много потраченных впустую усилий по сравнению с обучением у других.

Одно из мест, где можно найти небольшую помощь, - это этап определения процесса шести сигм, на котором используются инструменты, обеспечивающие сосредоточение проектов на реальных проблемах клиента. Хотя не каждый инструмент будет работать в контексте науки о данных, понимание основополагающей философии каждого инструмента даст важные подсказки о том, как обнаружить реальные проблемы клиента.

Эта последняя проблема - неправильное определение потребителями собственных потребностей - заслуживает отдельного изучения с некоторыми увлекательными и полезными обсуждениями из области медицины. Например, несмотря на то, что существует ряд важных различий между специалистом по обработке данных, проводящим собеседование с клиентом или покупателем, чтобы понять их потребности, не в последнюю очередь то, что клиент или покупатель часто является организацией, представленной несколькими людьми, есть много того, что можно применить к такие вопросы, как навыки аудирования, описаны во второй связанной статье.

Невозможность повторного использования собственной работы

Особенно душераздирающе смотреть на то, как огромная работа тратится на решение проблем, которые либо не существуют, либо не важны для предприятия.

Команда airbnb сделала это хорошо, по крайней мере, на своем счету, и они не единственные, кто видит выгоду. Теперь, хотя обе связанные истории подчеркивают, что R имеет отличную поддержку для создания библиотек, очевидно, что это также можно сделать на Python.

Фактически, даже такие базы данных, как SQL Server, имеют поддержку (очевидно, разную от реализации к реализации) для пользователей, которые хотят создавать повторно используемый код в той или иной форме - например, в этом MOOC обсуждается, как определяемые пользователем функции и хранятся процедуры могут применяться к базам данных SQL Server. Конечно, хотя это был пример MS SQL Server, большинство основных реализаций баз данных имеют свои собственные способы достижения тех же целей.

Загипнотизированный новизной

Легко потратить много времени на поиск последних и лучших новинок, особенно новых, более ярких пакетов, которые выполняют те же задачи, что и старые пакеты, но с некоторыми изменениями в презентации, которые заставляют их казаться более `` актуальными '' .

Проблема усугубляется, когда вы не тратите усилия на изучение ярких инструментов, которые на самом деле не нужны, а также не тратите усилия на изучение необходимых основ. Особенно, если вы упускаете из виду фундаментальные аспекты организации данных для анализа и выполнения строгого и целенаправленного исследовательского анализа данных перед более продвинутым моделированием, вы заставляете себя тратить впустую долгий путь для решения своей проблемы.

Принуждение к работе других

Когда наука о данных не является продуктом организации, логично предположить, что время, которое мы берем у других, - это время, которое они потратили бы на производство или продажу продукта. Даже когда специалист по данным работает в консалтинговой или аналогичной компании, где их усилия более или менее напрямую оплачиваются заказчиком, вам нужна помощь других.

Отличная работа, незаметная

Даже если вы работаете над правильной проблемой, вы все равно можете наткнуться на последнее препятствие, если вы плохо представите свою модель или не представите ее вообще. Если никто не использует вашу модель или даже если ею пользуется меньше людей, чем должно, весь потенциал не будет реализован.

Тщательно продумайте, как продать свою модель и как добиться, чтобы она была выбрана для использования. Кроме того, вы также должны стараться сохранить его в использовании, тщательно следя за ним. В целом, далеко не факт, что отличная модель получит то применение, которого она заслуживает; Хотя хорошо известная пословица гласит, что специалист по данным тратит 80% своего времени на подготовку данных, я бы сказал, что специалист по данным, чьи модели реализованы, будет тратить 80% своего времени на объяснение своих моделей и их результатов.

Пишите короткие статьи в блог

Никто не прислушается к вашим советам о том, как достичь большего с меньшими усилиями, если вы напишете слишком длинное объяснение того, как это сделать; Я остановлюсь на этом.