Прошел около года с тех пор, как я начал работать специалистом по данным после окончания колледжа. У меня было много разных ожиданий от этой области, и вот мои мысли по этому поводу.
Наука о данных действительно полезная область, и у нее есть свои плюсы и минусы. Учитывая мой ограниченный опыт и знания, я бы рекомендовал вам отнестись к моим взглядам с долей скепсиса.
Краткая предыстория
Я хотел бы вкратце рассказать обо мне, прежде чем продолжить, чтобы помочь вам понять, откуда я.
Еще со школьных времен мне нравилось заниматься математикой и я научился основному программированию. Позже я изучал электротехнику в ИИТ Бомбея. После окончания я поступил в консалтинговую фирму, специализирующуюся на искусственном интеллекте, где работал над проектами в области науки о данных для клиентов в Индии и Европе.
Должен сказать, что я все еще нахожусь на ранней стадии обучения. Иногда я делаю ошибки и задаюсь вопросом: чему я научился за все эти годы?
Чем больше я узнаю, тем меньше понимаю, что знаю. -Сократ
Наблюдения / комментарии (непроверенная гипотеза)
Как специалист по данным, вы не контролируете данные, вы придаете им форму, чтобы они могли лучше выражаться.
1. Наука о данных может быть действительно интересной, если…
Наука о данных - это редкая работа, в которой вы можете выполнять все крутые вещи вместе: математику, программирование и исследования. Работа, при которой вы можете читать исследовательскую работу утром, записывать алгоритм днем и кодировать его вечером. Это действительно весело! Несколько дней назад, когда я был в своей альма-матер, один молодой человек спросил меня: как бы я описал свой опыт работы?
Это все равно, что получать деньги за выполнение заданий!
Но вот в чем загвоздка: вам нужно «лишь немного» заниматься математикой, программированием и исследованиями. Вы не можете ни оставить это, ни позволить себе углубиться в это. В некоторых случаях вам, возможно, не придется читать какие-либо исследования, и вы можете напрямую использовать библиотеки кода и начать реализацию. И с учетом ограничений по времени единственная часть, в которой вы когда-либо получите возможность углубиться, - это подготовка данных (и презентации, которые должны быть сделаны, если таковые имеются).
Если вы человек, который любит кодировать и хочет делать это как можно больше, математика откусит вам голову. У вас не будет возможности продемонстрировать свои навыки программирования ниндзя. Как любитель кода, ставший специалистом по данным, у вас есть только два варианта: либо математика победит вас, либо вы победите ее. Если вы любитель математики и решаете сложные задачи, подготовка данных и монотонное программирование утомят вас до смерти. Мне нравится такая аналогия:
Представьте, что вы почувствуете, если кто-то даст вам степлер и отправит вас в комнату, полную бумаг, которые нужно заказать и сшить? Вот как выглядит процесс очистки данных.
Иногда вам может казаться, что если бы кто-то другой мог подготовить данные, и вы могли бы просто построить модель на его основе, но, к сожалению или к счастью, это не работает.
Кто-то может возразить, что те вещи, которые вам не нравятся, занимают лишь небольшую часть работы, но дело в том, что они имеют тенденцию оказывать непропорциональное влияние на вашу работу (прочтите принцип Парето).
Способ поддерживать науку о данных - это найти правильный баланс между кодированием и математикой / исследованиями. И, что наиболее важно, цените различные аспекты своей работы, сохраняя при этом фокус на достижении результатов.
Кроме того, наука о данных, являющаяся развивающейся областью и не имеющей определенного руководства к успеху, требует много тяжелой работы, непрерывного обучения и, самое главное, отучения (вы не знаете, когда «лучшее» станет просто «хорошим»).
Обобщить:
- Плюсы: наука о данных позволяет работать сразу с множеством интересных вещей: кодом, математикой, исследованиями, а иногда и с презентациями.
- Минусы: наука о данных может не позволить вам углубиться в какие-либо ее отдельные аспекты.
2. Наука о данных - это скорее бизнес, чем наука.
"Что в имени?" спросил мудрый человек. Раздались два ответа:
- «Ничего», - сказал философ.
- «Все», - сказали маркетологи.
Специалисты по обработке данных в отрасли не похожи на ученых, работающих, скажем, в ЦЕРНе или ISRO. На самом деле специалисты по анализу данных применяют научные методы для создания ценности для бизнеса. Работа специалистов по данным заключается не просто в том, чтобы найти лучшее решение, а в том, чтобы найти решение, которое легко интерпретировать и продавать.
В науке о данных, когда сталкиваются с конкурирующими гипотезами, бизнес-логика часто превосходит научную.
Знания искусственного интеллекта, особенно его подполя - машинного обучения, достаточно для начала, но недостаточно, чтобы продвинуться вперед.
Чтобы преуспеть в проектах по науке о данных, «науки» недостаточно, вам также необходимо разбираться в экономике и маркетинге, чтобы выполнять свою работу и создавать ценность для бизнеса.
3. Работа специалиста по данным эффективна, но, как и любая «другая» работа.
Как специалист по анализу данных у вас есть «потенциал» для оказания огромного «влияния», но он есть у вас как у учителя, инженера-программиста, журналиста или продавца.
Наука о данных, бесспорно, меняет наш мир, но области, в которых как специалист по анализу данных вы можете сыграть решающую роль и «повлиять», редки.
Наука о данных, которую распространяют как загадку для «изменения» мира в Интернете, не всегда соответствует действительности.
Более того, термин «воздействие» очень субъективен и имеет много важных аспектов, таких как:
- какую денежную ценность он имеет / создает
- кому это принесет наибольшую пользу
- насколько уникальна и важна ваша роль в этом
- в какой степени это самовоспроизводящийся
Вид «воздействия», о котором говорит Интернет, и то, что бизнес может предоставить вам, может быть самым разным.
Если вы умный и амбициозный человек, который занимается наукой о данных, чтобы оказать «влияние», убедитесь, что вы «подходите» для этой области и ваше значение воздействия соответствует тому влиянию, которое может оказать вам бизнес.
4. Сегодняшняя экономика диктует науку о данных
На сегодняшний день специалист по работе с данными - это «горячая» работа, и нередко несколько рекрутеров регулярно связываются с вами, чтобы узнать, хотите ли вы поменяться. Специалисты по обработке данных пользуются большим уважением в организации и получают хорошую зарплату.
Я не рекомендую вам становиться специалистом по анализу данных, если деньги - ваша главная мотивация.
Если вы занимаетесь наукой о данных только ради денег, имейте в виду, что рано или поздно из-за той же экономики высокие зарплаты исчезнут. Только ваш интерес к области будет поддерживать вас.
5. Опыт Data Scientist как ступенька
Работа в качестве специалиста по данным может помочь вам создать прочную основу для мира, основанного на данных, и более реалистично оценить ограничения и возможности технологий, связанных с искусственным интеллектом.
Даже если вы решите отойти от практической работы, опыт Data Scientist может оказаться ценным в ваших будущих начинаниях. Некоторые из них:
- Академические исследования (магистры / доктора наук / докторанты / независимые специалисты). Специалист по анализу данных тратит много времени на эксперименты, чтение научных статей и обсуждение идей со своими коллегами. Вся эта деятельность может оказаться ценным активом для проведения исследований.
- Стартапы. Конечно, вы можете работать в технической должности в стартапе с искусственным интеллектом или начать свой собственный после работы специалистом по анализу данных. Но вы также можете заниматься нетехническими ролями в стартапе AI, такими как продажи, бизнес-планирование или финансы. Ваши знания могут помочь вам лучше понять и продать продукт клиентам, оценить затраты и требования проекта и, самое главное, не чувствовать себя посторонним. Могут быть разные причины, по которым вы можете захотеть работать в нетехнической роли после получения опыта работы в качестве специалиста по данным. Возможно, вам стоит посмотреть на количество людей, которые регулярно кодируют в исполнительной команде любой успешной технологической компании.
- Правительство и глобальные организации: правительства все больше и больше беспокоятся о влиянии систем искусственного интеллекта на общество и о том, как наилучшим образом использовать их для устойчивого развития. Вы можете использовать опыт своего специалиста по данным для работы в ролях, связанных с политикой искусственного интеллекта, где требуется глубокое понимание искусственного интеллекта для разработки политик и правил, наиболее подходящих для общества.
Примечание. Это мои личные взгляды, и вы можете согласиться или не согласиться с ними. Я не собирался писать о том, как выглядит идеальная работа Data Scientist, или как «должна» быть реализована наука о данных, или даже описывать, кто такой Data Scientist. Я хотел поделиться несколькими важными указаниями, которые я усвоил, работая «специалистом по данным» в течение года сразу после колледжа.
Ваш опыт может сильно отличаться от того, что я описал выше. Я рекомендую вам поделиться своим опытом в комментариях ниже или написать об этом отдельно. Это было бы большим подспорьем для людей, которые хотят глубже погрузиться в науку о данных.
Если вам понравилась статья, подписывайтесь на меня Абхишек Парбхакар, чтобы увидеть больше статей, связанных с ИИ, философией и экономикой.