Введение

«Данные — это новая нефть». В связи с массовым увеличением объемов данных потребность в аналитиках данных и специалистах по данным возросла во всем мире. Kaggle — это сообщество, где данные встречаются с учеными, работающими с данными. Kaggle провел опрос в 2019 году, чтобы выяснить скрытые идеи из области науки о данных. Всего было 19717 участников опроса со всего мира.

Если мы посмотрим на респондентов из Топ-10 стран:

Индия состоит из наибольшей доли, за которой следуют США. В этом посте я постараюсь ответить на несколько вопросов об индийском сообществе Data Science.

Часть I: Каково гендерное распределение в этой области?

Как видим, существует огромный гендерный дисбаланс. Это область с преобладанием мужчин, в которой 82,7% мужчин. Нам нужно поощрять женщин-разработчиков больше увлекаться наукой о данных.

Часть II: Зарабатывают ли в Индии больше люди с ученой степенью?

Мне особенно хотелось найти ответ на этот вопрос.

Если мы присмотримся, то обнаружим, что зарплата многих людей находится в диапазоне от 0 до 999 долларов. В основном это связано с тем, что индийским разработчикам недоплачивают по сравнению с разработчиками из других стран.

Мы можем видеть небольшой скачок в зарплате людей среднего звена, но зарплаты в основном примерно одинаковы.

Часть III: Какие должностные обязанности выполняют большинство индийских кагглеров?

Как и ожидалось, большинство людей нанимают в качестве специалистов по данным. Но на втором месте мы можем видеть инженеров-программистов. Это указывает на то, что большинство инженеров-программистов пытаются перейти в область науки о данных.

Часть IV: Каково возрастное распределение индийских кагглеров?

Как мы видим, большинство людей находятся в возрастном диапазоне от 18 до 29 лет. Это означает, что индийское сообщество ML & DS относительно молодо, возможно, потому, что они быстро учатся!

Вывод

В этой статье мы кратко рассмотрели индийское сообщество Data Science. Чему мы можем научиться?

  1. Нам нужны девушки-разработчики в этой области.
  2. Выполнение последипломного образования имеет минимальное влияние на зарплату.
  3. Людей нанимают в основном как специалистов по данным.
  4. Средний возраст большинства людей составляет от 18 до 39 лет.

Надеюсь, вам понравилось чтение! Если вы хотите проверить полный анализ и код, проект находится на GitHub:

https://github.com/curiousrohan/kaggle-india-analysis

Выводы здесь являются наблюдательными, а не результатом формального исследования.