"Часы работы"

7 черт невероятно эффективных специалистов по данным

Чтобы стать эффективным специалистом по данным, вы должны сначала стать эффективным

Регулярная жалоба на науку о данных заключается в том, что многие из повседневных задач, связанных с работой, являются повторяющимися, избыточными и требуют много времени.

Эта напряженная работа часто упоминается среди многих причин, по которым специалисты по обработке данных недовольны своей работой, многие из которых думали, что они всегда будут работать над интересными проектами и выполнять важные для компании анализы.

Однако когда приходит реальность, приходит осознание того, что большая часть работы может быть монотонной и не такой захватывающей, как решение больших реальных проблем.

Многие люди говорят о важности того, чтобы быть эффективным специалистом по данным, хотя немногие обсуждают, как люди могут стать эффективными специалистами по данным. Эффективность - это один из столпов эффективности, и вместе с эффективностью будет повышаться удовлетворенность работой, поскольку эти скучные задачи уходят в прошлое (или, по крайней мере, в автоматизированное будущее).

1. Они автоматизируют повторяющиеся задачи.

Наука о данных построена на повторяющихся задачах, включая основы получения, подготовки и очистки данных. Существует общепринятое эмпирическое правило: специалисты по данным тратят 80% своего времени на эти задачи.

К сожалению, такие повторяющиеся и часто отупляющие задачи отнимают так много времени, особенно когда именно такие забавные вещи, как анализ данных, визуализация и моделирование, в первую очередь привлекли людей в науку о данных.

Хотя получение, подготовка и очистка данных жизненно важны для успеха проекта, они не являются действиями, которые приносят определенную рентабельность инвестиций - это просто задачи по достижению рентабельности инвестиций в конце. Разве не имеет смысла тратить большую часть своего времени на задачи, которые возвращают определенную рентабельность инвестиций, и использовать автоматизацию для решения других задач?

Автоматизация задач с низкой рентабельностью инвестиций, которые занимают большую часть вашего времени, позволяет повысить эффективность и тратить меньше времени на рутинные задачи. Хотя будут подробности относительно сбора и очистки данных для каждого проекта, все еще можно автоматизировать процесс после того, как будут установлены ваши требования.

Как автоматизировать сбор данных:



Как автоматизировать очистку данных:







Как автоматизировать проверку кода:



2. Они используют самый простой инструмент для работы.

Вы не поверите, но не каждый анализ данных требует машинного обучения и искусственного интеллекта.

Самый эффективный способ решить проблему - использовать самый простой из возможных инструментов.

Иногда простая таблица Excel может дать тот же результат, что и большой модный алгоритм, использующий глубокое обучение.

Если с самого начала выбрать правильные алгоритмы и инструменты, проект по науке о данных станет намного более эффективным. Хотя здорово удивить всех сверхсложным инструментом, в долгосрочной перспективе это не имеет смысла, когда можно было бы потратить меньше времени на более простое и эффективное решение.

Вот несколько ресурсов, которые помогут вам выбрать лучшие инструменты и алгоритмы для вашего следующего проекта в области науки о данных:





3. Они следуют строгой структуре кодирования.

Правильное выполнение работы с первого раза - самый эффективный способ завершить любой проект.

Когда дело доходит до науки о данных, это означает написание кода с использованием строгой структуры, которая позволяет легко вернуться и просмотреть, отладить, изменить и даже подготовить код к производству.

Четкие инструкции по синтаксису позволяют каждому понимать чужой код. Однако рекомендации по синтаксису существуют не только для того, чтобы вы могли понять чужую куриную царапину - они также существуют, чтобы вы могли сосредоточиться на написании максимально чистого и эффективного кода.

Мало что может быть хуже, чем написать код целого проекта, а затем вернуться и реорганизовать весь код, чтобы он соответствовал рекомендациям компании.

Сэкономьте время, ознакомившись с передовыми методами кодирования, передовыми методами разработки программного обеспечения, а также с конкретными руководящими принципами и требованиями по синтаксису вашей компании.

Вот несколько ресурсов, которые помогут вам следовать передовым методам:





4. Вокруг них есть команда, которая может помочь им решить проблемы.

Никто не является океаном, и специалисты по данным не исключение.

Хотя решение сложной проблемы может быть волнующим и невероятно удовлетворительным, это может быть не в ваших интересах, если на это у вас ушло больше часов, чем необходимо.

Я могу вспомнить несколько конкретных случаев, когда я застревал и отказывался просить о помощи. После нескольких часов (а иногда и дней) ударов головой о стену, пытаясь решить проблему, я сдавался и спрашивал кого-нибудь, только чтобы узнать, что их решение, которое они дали мне менее чем за пять минут, займет всего несколько секунд. осуществлять.

Другими словами, наиболее эффективные специалисты по обработке данных не боятся просить о помощи, и, кроме того, их окружает команда, состоящая из людей, способных дать им нужные ответы. Плохая командная среда - одна из причин, по которой так много специалистов по данным уходят с работы, что еще раз подчеркивает важность того, чтобы вокруг вас была хорошая команда.

Вот несколько ресурсов, которые помогут вам начать создавать более эффективные команды по анализу данных:





5. Они выделяют время, чтобы узнать новое и улучшить себя.

Самосовершенствование - один из краеугольных камней эффективности. Без улучшений не может быть повышения эффективности.

Самые эффективные специалисты по данным находят время, чтобы узнать что-то новое и стать лучше.

Будь то завершение еженедельного обзора литературы или выделение нескольких часов в неделю для работы с MOOC, специалисты по обработке данных становятся более эффективными по мере расширения своей базы знаний.

Наука о данных - это быстро меняющийся ландшафт с появлением новых языков каждый год, постоянным выпуском множества научных статей о новых методах и постоянно растущим сообществом, которое собирается вместе, чтобы поделиться новыми идеями о том, как делать что-то по-другому.

Единственный способ оставаться в курсе всего и оставаться актуальным - это выделить время на обучение.

Вы можете начать с того, что каждую неделю будете выделять несколько часов на обучение и ставить перед собой задачу на каждое занятие. Например, в среду в течение одного часа вы читаете и рецензируете новую статью по машинному обучению. В течение часа в пятницу вы будете практиковаться в создании генеративных состязательных сетей (GAN). Наконец, в воскресенье вы работаете над личным проектом или полным вызовом кодирования на Hacker Rank или Kaggle.

Выделив небольшие отрезки времени для конкретных задач, станет легче выработать еженедельную привычку к самосовершенствованию.

Вот несколько ресурсов, которые помогут вам начать работу с обзорами литературы, личными проектами и МООК.







6. Они используют лучшую визуализацию для работы, чтобы избежать искажения данных.

Как я упоминал ранее, самый быстрый путь к эффективности - это выполнить работу правильно с первого раза.

Это означает не только кодирование с использованием правильной структуры синтаксиса, но и использование правильных визуализаций с самого начала, чтобы гарантировать, что вы случайно не искажаете данные.

Выбор правильной визуализации важен не только для целостности данных, но и для понимания того, о чем они вам говорят. Поскольку визуализация данных часто является одной из первых задач, выполняемых перед любым моделированием или анализом, важно сделать это правильно с первого раза, чтобы вы знали, с чем имеете дело.

Вот несколько ресурсов, которые помогут вам понять различные типы визуализации данных и когда их использовать:





7. Они составляют план атаки до того, как напишут какой-либо код или очистят какие-либо данные.

Один из лучших советов, которые я когда-либо усвоил, когда изучал разработку программного обеспечения в университете, - это всегда составлять план перед написанием любого кода.

Будь то блок-схема, пошаговый мыслительный процесс, псевдокод или контрольный список, наличие плана атаки перед выполнением каких-либо действий, связанных с наукой о данных, имеет решающее значение для успеха и эффективности проекта.

Я не могу вспомнить, сколько раз я кодировал (без плана), а потом кто-то приходил и прерывал меня, пока я занимался построением какой-то сложной логики. Вернувшись к работе, я понял, что потерял ход мыслей и понятия не имел, куда мне нужно двигаться дальше. Если бы у меня был план, я бы смог продолжить с того места, где остановился.

Планы полезны не только для поддержания вашего мыслительного процесса - они также жизненно важны для решения проблем, когда что-то идет не так. Наличие плана поможет вам вернуться к шагам, которые вы предприняли, чтобы чего-то достичь, что полезно, когда дело доходит до выявления ошибок или областей, в которых ваша логика не совсем оправдалась.

Наличие планов позволит вам писать код быстрее и эффективнее и не даст вам тратить драгоценное время на попытки вернуться к своим мыслям, когда они неизбежно покидают станцию ​​без вас.

Вот несколько ресурсов, которые помогут вам лучше писать блок-схемы и псевдокод, чтобы повысить эффективность кодирования:





Бонус: 8. Оптимизируют свой ежедневный рабочий процесс.

Наука о данных - одна из тех профессий, где от вас ожидают идеального выполнения множества различных задач в любой день. Однако для большинства этих задач требуются разные наборы навыков, что может затруднить переход от задачи к задаче. Более того, это часто связано с полным сдвигом мышления, когда вы работаете над различными аспектами разных проектов, которые у вас есть на ходу.

Решением этой проблемы является оптимизация повседневного рабочего процесса для повышения эффективности и производительности. Нет, это не означает многозадачность. Это означает использование таких систем, как группировка задач, блокировка времени или дневная тематика, в которых вы работаете в течение определенного периода времени над задачами одного и того же типа и только над задачами этого типа.

Проще говоря, группирование ежедневных задач избавляет вас от необходимости выполнять необходимую умственную гимнастику, чтобы переключить свой мыслительный процесс в соответствии с совершенно другими задачами.

Есть несколько способов группировать задачи:

  1. Пакетные задачи по типу (пример: с 9:00 до 12:00 вы выполняете очистку данных для всех своих проектов)
  2. Пакетные задачи по фокусу (пример: с 9:00 до 12:00 вы выполняете задачи, связанные с проектом X)

Первый тип примеров позволяет вам оставаться в мышлении об очистке данных, выполняя очистку всех ваших данных для всех ваших проектов. Второй тип примеров позволяет вам полностью сосредоточиться на проекте X, поэтому вы выполняете все свои задачи в течение дня, связанные с проектом X. В зависимости от того, как вы работаете лучше всего, вы можете обнаружить, что сосредоточение внимания на одном конкретном типе задачи или одной конкретной задаче. проект на определенный период времени будет для вас наиболее эффективным.

Вот отличный ресурс, который дает более подробные сведения о блокировке времени, группировке задач и дневной тематике:



Последние мысли.

В сверхконкурентной области науки о данных о данных ученых судят по их способности положительно повлиять на компанию. Это положительное влияние сопровождается повышением эффективности, что, в свою очередь, приводит к повышению эффективности.

Реализуя вышеупомянутые черты эффективных специалистов по обработке данных, вы станете специалистом по обработке данных, который сможет обеспечить тот жизненно важный уровень воздействия, которого добиваются компании.