Наука о данных — относительно новая профессия, и ее определение открыто для обсуждения. Его границы еще четко не очерчены. Как человек, изучающий науку о данных на буткемпе, мне интересно, как эта область будет развиваться и каково будет мое место в ней.

Большая часть внимания средств массовой информации к науке о данных сосредоточена на том, сколько существует рабочих мест в области науки о данных и как быстро она растет как область. В качестве противовеса ажиотажу авторы Forbes и Fortune предупреждают потенциальных специалистов по данным, что им нужно будет «развиваться или остаться позади» и что ничто не длится вечно соответственно.

Что он? Является ли специалист по обработке и анализу данных самой востребованной профессией в 21 веке, или это профессия, которая вот-вот исчезнет, ​​когда на смену придет ИИ? Давайте подробнее рассмотрим предупреждения, исходящие от Forbes и Fortune.

На Forbes.com Рудина Сесери проводит параллель между ранними программистами прошлого и учеными данных сегодня. Ранние программисты разработали новые библиотеки и языки, которые автоматизировали многие из задач, которые когда-то отнимали у них много времени, что, в свою очередь, вынуждало их изучать новые языки и методы, чтобы оставаться актуальными и конкурентоспособными по сравнению с новыми программистами, которые начинали с более легкого обучения. , более быстрые языки программирования. Сесери утверждает, что наука о данных проходит аналогичную эволюцию. Она пишет: В краткосрочной перспективе технологии искусственного интеллекта создают реальную потребность в специалистах по данным, причем спрос намного превышает предложение квалифицированных специалистов. В долгосрочной перспективе, по мере того как ИИ будет устанавливать и анализировать причинно-следственные связи, а также корреляции, этот анализ будет выполнять программное обеспечение, а не люди. И специалисты по данным — по крайней мере, успешные — перейдут от своих нынешних ролей к специалистам по машинному обучению или к какой-то другой новой категории знаний, имя которой еще не названо.

Обратите внимание, что если аналогия Сесери верна, то все еще будут специалисты по данным, которые преуспеют. Как и в других областях технологий, успешными будут те, кто раздвигает границы, внедряет инновации там, где это имеет смысл, и продолжает развиваться и расти. Конечно, некоторые специалисты по обработке и анализу данных могут остаться позади по мере развития технологии, но это произойдет не потому, что ИИ захватит всю область. Это может быть связано с тем, что некоторые специалисты по данным не могут или не хотят продолжать оттачивать свои навыки.

В Fortune, — предупреждает Барб Дэрроу, — термин «специалист по данным — расплывчатое понятие. Вообще говоря, ожидается, что практикующие специалисты знакомы со статистическим анализом, прогностическим моделированием и программированием. Да, и наличие определенного художественного чутья для визуализации результатов является несомненным плюсом. Но спросите дюжину менеджеров по найму, и вы получите дюжину вариаций на эту тему». Другими словами, нет единого мнения о том, что такое наука о данных, а что нет, и люди, кажется, хотят, чтобы специалисты по данным могли делать все это, как волшебные единороги. Справедливо. Как и в других новых областях, я подозреваю, что наука о данных со временем разберется с этим. По мере развития области ее границы станут более четкими, она будет делиться на подполя с более понятными названиями или и то, и другое. Я думаю, что эта проблема со временем решится сама собой, когда наука о данных вступит в свои права.

Дэрроу предлагает еще два предупреждения, к обоим из которых стоит отнестись серьезно.

Во-первых, новые инструменты автоматизируют важные части рабочего процесса. Например, Tableau и ее конкуренты уже проделали большую работу по созданию привлекательных визуализаций данных. Эти инструменты позволяют лучшим специалистам по данным вывести свои навыки визуализации на новый уровень. Они не лишают работы хороших специалистов по данным; они выводят науку на новый уровень.

Во-вторых, Дэрроу отмечает, что все больше и больше людей увлекаются наукой о данных. Сейчас вакансий больше, чем квалифицированных кандидатов. Но число тех, кто изучает науку о данных, растет. Буткемпов много. Колледжи и университеты начинают предлагать курсы по науке о данных и программы на получение степени. Существует множество онлайн-сайтов, предлагающих курсы, учебные пособия, игры и советы бесплатно или по относительно низкой цене. Недавние темпы роста числа рабочих мест в области науки о данных не являются устойчивыми; цифры, безусловно, стабилизируются и могут даже уменьшиться в какой-то момент не слишком далеко в будущем. В настоящее время ощущается нехватка квалифицированных специалистов по данным, но новое поколение специалистов по данным уже осваивает навыки, необходимые им для достижения успеха.

Мне кажется, что истина лежит где-то между ажиотажем о том, что наука о данных является самой популярной профессией 21-го века, и предупреждениями о том, что ИИ и автоматизация лишают работы специалистов по данным. Важность хорошей науки о данных легко переоценить, но она останется важной областью, которая может многое предложить. Он также движется к большей автоматизации. Это хорошие новости! Например, автоматизация трудоемких задач по очистке и форматированию данных высвободит время специалистам по данным, чтобы они могли сосредоточиться на теоретических достижениях и новом анализе. Автоматизируя более рутинные аспекты работы, ученые-данные могут уделять больше внимания творческим аспектам работы, которые нельзя автоматизировать. Человеческий элемент хорошей науки о данных не может быть полностью заменен алгоритмами, машинным обучением или даже глубоким обучением. Хотя ИИ и другие технологии могут сократить количество аналитиков данных и ученых, необходимых для науки о данных, они не могут заменить теоретизирование, анализ и интерпретацию, которые вносит хороший специалист по данным.

Лично я извлек из всего этого урок, что для того, чтобы преуспеть в науке о данных и во многих областях, необходимо постоянное обучение. Я, например, приветствую усилия по автоматизации более рутинных аспектов работы с данными. Я еще научусь их делать для себя. Мне нужно понимать, в чем заключается работа, если я собираюсь обучить программу делать ее за меня или доверять чьей-то другой программе, чтобы она справилась с ней хорошо. Но эти программы не оставят меня позади, пока я учусь и расту в своем понимании концептуальных и человеческих аспектов науки о данных и пока я продолжаю развивать свои технические навыки. Это прогресс.