Прошел около года с тех пор, как я начал работать специалистом по данным после окончания колледжа. У меня было много разных ожиданий от этой области, и вот мои мысли по этому поводу.

Наука о данных действительно полезная область, и у нее есть свои плюсы и минусы. Учитывая мой ограниченный опыт и знания, я бы рекомендовал вам отнестись к моим взглядам с долей скепсиса.

Краткая предыстория

Я хотел бы вкратце рассказать обо мне, прежде чем продолжить, чтобы помочь вам понять, откуда я.

Еще со школьных времен мне нравилось заниматься математикой и я научился основному программированию. Позже я изучал электротехнику в ИИТ Бомбея. После окончания я поступил в консалтинговую фирму, специализирующуюся на искусственном интеллекте, где работал над проектами в области науки о данных для клиентов в Индии и Европе.

Должен сказать, что я все еще нахожусь на ранней стадии обучения. Иногда я делаю ошибки и задаюсь вопросом: чему я научился за все эти годы?

Чем больше я узнаю, тем меньше понимаю, что знаю. -Сократ

Наблюдения / комментарии (непроверенная гипотеза)

Как специалист по данным, вы не контролируете данные, вы придаете им форму, чтобы они могли лучше выражаться.

1. Наука о данных может быть действительно интересной, если…

Наука о данных - это редкая работа, в которой вы можете выполнять все крутые вещи вместе: математику, программирование и исследования. Работа, при которой вы можете читать исследовательскую работу утром, записывать алгоритм днем ​​и кодировать его вечером. Это действительно весело! Несколько дней назад, когда я был в своей альма-матер, один молодой человек спросил меня: как бы я описал свой опыт работы?

Это все равно, что получать деньги за выполнение заданий!

Но вот в чем загвоздка: вам нужно «лишь немного» заниматься математикой, программированием и исследованиями. Вы не можете ни оставить это, ни позволить себе углубиться в это. В некоторых случаях вам, возможно, не придется читать какие-либо исследования, и вы можете напрямую использовать библиотеки кода и начать реализацию. И с учетом ограничений по времени единственная часть, в которой вы когда-либо получите возможность углубиться, - это подготовка данных (и презентации, которые должны быть сделаны, если таковые имеются).

Если вы человек, который любит кодировать и хочет делать это как можно больше, математика откусит вам голову. У вас не будет возможности продемонстрировать свои навыки программирования ниндзя. Как любитель кода, ставший специалистом по данным, у вас есть только два варианта: либо математика победит вас, либо вы победите ее. Если вы любитель математики и решаете сложные задачи, подготовка данных и монотонное программирование утомят вас до смерти. Мне нравится такая аналогия:

Представьте, что вы почувствуете, если кто-то даст вам степлер и отправит вас в комнату, полную бумаг, которые нужно заказать и сшить? Вот как выглядит процесс очистки данных.

Иногда вам может казаться, что если бы кто-то другой мог подготовить данные, и вы могли бы просто построить модель на его основе, но, к сожалению или к счастью, это не работает.

Кто-то может возразить, что те вещи, которые вам не нравятся, занимают лишь небольшую часть работы, но дело в том, что они имеют тенденцию оказывать непропорциональное влияние на вашу работу (прочтите принцип Парето).

Способ поддерживать науку о данных - это найти правильный баланс между кодированием и математикой / исследованиями. И, что наиболее важно, цените различные аспекты своей работы, сохраняя при этом фокус на достижении результатов.

Кроме того, наука о данных, являющаяся развивающейся областью и не имеющей определенного руководства к успеху, требует много тяжелой работы, непрерывного обучения и, самое главное, отучения (вы не знаете, когда «лучшее» станет просто «хорошим»).

Обобщить:

  • Плюсы: наука о данных позволяет работать сразу с множеством интересных вещей: кодом, математикой, исследованиями, а иногда и с презентациями.
  • Минусы: наука о данных может не позволить вам углубиться в какие-либо ее отдельные аспекты.

2. Наука о данных - это скорее бизнес, чем наука.

"Что в имени?" спросил мудрый человек. Раздались два ответа:

  • «Ничего», - сказал философ.
  • «Все», - сказали маркетологи.

Специалисты по обработке данных в отрасли не похожи на ученых, работающих, скажем, в ЦЕРНе или ISRO. На самом деле специалисты по анализу данных применяют научные методы для создания ценности для бизнеса. Работа специалистов по данным заключается не просто в том, чтобы найти лучшее решение, а в том, чтобы найти решение, которое легко интерпретировать и продавать.

В науке о данных, когда сталкиваются с конкурирующими гипотезами, бизнес-логика часто превосходит научную.

Знания искусственного интеллекта, особенно его подполя - машинного обучения, достаточно для начала, но недостаточно, чтобы продвинуться вперед.

Чтобы преуспеть в проектах по науке о данных, «науки» недостаточно, вам также необходимо разбираться в экономике и маркетинге, чтобы выполнять свою работу и создавать ценность для бизнеса.

3. Работа специалиста по данным эффективна, но, как и любая «другая» работа.

Как специалист по анализу данных у вас есть «потенциал» для оказания огромного «влияния», но он есть у вас как у учителя, инженера-программиста, журналиста или продавца.

Наука о данных, бесспорно, меняет наш мир, но области, в которых как специалист по анализу данных вы можете сыграть решающую роль и «повлиять», редки.

Наука о данных, которую распространяют как загадку для «изменения» мира в Интернете, не всегда соответствует действительности.

Более того, термин «воздействие» очень субъективен и имеет много важных аспектов, таких как:

  • какую денежную ценность он имеет / создает
  • кому это принесет наибольшую пользу
  • насколько уникальна и важна ваша роль в этом
  • в какой степени это самовоспроизводящийся

Вид «воздействия», о котором говорит Интернет, и то, что бизнес может предоставить вам, может быть самым разным.

Если вы умный и амбициозный человек, который занимается наукой о данных, чтобы оказать «влияние», убедитесь, что вы «подходите» для этой области и ваше значение воздействия соответствует тому влиянию, которое может оказать вам бизнес.

4. Сегодняшняя экономика диктует науку о данных

На сегодняшний день специалист по работе с данными - это «горячая» работа, и нередко несколько рекрутеров регулярно связываются с вами, чтобы узнать, хотите ли вы поменяться. Специалисты по обработке данных пользуются большим уважением в организации и получают хорошую зарплату.

Я не рекомендую вам становиться специалистом по анализу данных, если деньги - ваша главная мотивация.

Если вы занимаетесь наукой о данных только ради денег, имейте в виду, что рано или поздно из-за той же экономики высокие зарплаты исчезнут. Только ваш интерес к области будет поддерживать вас.

5. Опыт Data Scientist как ступенька

Работа в качестве специалиста по данным может помочь вам создать прочную основу для мира, основанного на данных, и более реалистично оценить ограничения и возможности технологий, связанных с искусственным интеллектом.

Даже если вы решите отойти от практической работы, опыт Data Scientist может оказаться ценным в ваших будущих начинаниях. Некоторые из них:

  • Академические исследования (магистры / доктора наук / докторанты / независимые специалисты). Специалист по анализу данных тратит много времени на эксперименты, чтение научных статей и обсуждение идей со своими коллегами. Вся эта деятельность может оказаться ценным активом для проведения исследований.

  • Стартапы. Конечно, вы можете работать в технической должности в стартапе с искусственным интеллектом или начать свой собственный после работы специалистом по анализу данных. Но вы также можете заниматься нетехническими ролями в стартапе AI, такими как продажи, бизнес-планирование или финансы. Ваши знания могут помочь вам лучше понять и продать продукт клиентам, оценить затраты и требования проекта и, самое главное, не чувствовать себя посторонним. Могут быть разные причины, по которым вы можете захотеть работать в нетехнической роли после получения опыта работы в качестве специалиста по данным. Возможно, вам стоит посмотреть на количество людей, которые регулярно кодируют в исполнительной команде любой успешной технологической компании.

  • Правительство и глобальные организации: правительства все больше и больше беспокоятся о влиянии систем искусственного интеллекта на общество и о том, как наилучшим образом использовать их для устойчивого развития. Вы можете использовать опыт своего специалиста по данным для работы в ролях, связанных с политикой искусственного интеллекта, где требуется глубокое понимание искусственного интеллекта для разработки политик и правил, наиболее подходящих для общества.

Примечание. Это мои личные взгляды, и вы можете согласиться или не согласиться с ними. Я не собирался писать о том, как выглядит идеальная работа Data Scientist, или как «должна» быть реализована наука о данных, или даже описывать, кто такой Data Scientist. Я хотел поделиться несколькими важными указаниями, которые я усвоил, работая «специалистом по данным» в течение года сразу после колледжа.

Ваш опыт может сильно отличаться от того, что я описал выше. Я рекомендую вам поделиться своим опытом в комментариях ниже или написать об этом отдельно. Это было бы большим подспорьем для людей, которые хотят глубже погрузиться в науку о данных.

Если вам понравилась статья, подписывайтесь на меня Абхишек Парбхакар, чтобы увидеть больше статей, связанных с ИИ, философией и экономикой.