Мы все знаем, что каждая область или предмет или что-то, что вас интересует, будет иметь некоторые мифы (ложные убеждения или идеи).

Точно так же, неудивительно, у нас есть некоторые мифы в области Data Science, которым не следует верить, особенно новичкам и стремящимся.

Если вы хотите получить четкое представление об этом, прочитайте эту статью до конца, и вы не пожалеете.

У меня есть 9 пунктов, чтобы объяснить, давайте обсудим подробно…

1. Вам необходимо иметь степень магистра или доктора наук.

Итак, это очень распространенный среди многих людей миф о том, что им нужны магистры или доктора наук, чтобы получить образование в этой области, — что является полным мифом.

На самом деле вы можете получить работу в этой области, имея диплом бакалавра… но навыки играют здесь главную роль.

Вы должны овладеть всеми необходимыми навыками, и если вы новичок, попробуйте выполнить несколько сквозных проектов и подать заявку на стажировку, чтобы получить практический опыт, который повысит ваши шансы на получение полной временная работа.

В конце концов, имея степень магистра или доктора философии, вы можете получить работу с высокой зарплатой, но помните, что и без этого мы также можем войти в эту область.

мы можем заключить, что наличие магистров и докторов наук хорошо, но не обязательно.

2. Вам нужен сертификат Data Science, чтобы стать Data Scientist.

Мы снова получаем тот же ответ, что сертификация не обязательна, но хорошо, что она есть.

Зачем?

Поскольку данные в реальном мире отличаются от данных обучения, а также знание науки о данных гораздо важнее, чем наличие сертификата.

Упоминание сертификата в резюме просто дает рекрутеру идею задать вопрос о пройденном вами курсе, но главное, вы должны иметь представление о проделанной работе.

мы приходим к выводу, что знание науки о данных важнее сертификата.

3. Ваш предыдущий опыт работы не важен.

Это миф.. помните, что наука о данных — это не просто одна работа, мы выполняем множество работ.

Ваш предыдущий опыт работы будет определенно полезен.

Если вы пытаетесь изменить свою карьеру в сторону науки о данных, ваш предыдущий опыт работы также имеет значение.

Для первокурсников проект работает и помогает стажировка с достойной работой.

4. Вы должны иметь опыт работы в области компьютерных наук/статистики или программирования.

Вам не обязательно быть из кого-либо из этих слоев общества. Многие люди из других слоев общества преуспели в этой области.

люди с нетехническим образованием успешно работают в этой области.

В настоящее время изучение программирования стало проще, так как есть много бесплатных ресурсов.

Ключевым моментом здесь является усилие, которое вы прилагаете для приобретения навыков, которые определенно помогут вам получить работу, независимо от вашего опыта.

5. Наука о данных — это построение моделей.

Что не совсем правда.

В науке о данных мы выполняем различные задачи, такие как:

  • Обсуждение с владельцем продукта,
  • Сбор требований,
  • Понимание того, какие данные важны,
  • Следя за жизненным циклом проекта,
  • Эффективное хранение данных в любых других базах данных.

А также в жизненном цикле у нас есть такие шаги, как:

  • Сбор данных
  • Очистка данных
  • Предварительная обработка данных
  • Исследовательский анализ данных (EDA)
  • Разработка функций
  • Обучение модели
  • Оценка модели
  • Улучшение модели с настройкой гиперпараметров
  • Развертывание модели в продакшене

Таким образом, все эти шаги должен предпринять специалист по данным при выполнении проекта, а не только в построении модели.

6. Kaggle, Hackathon и реальные проекты — это одно и то же.

Это снова отдельный миф

Четко поймите, что соревнование Kaggle предназначено только для того, чтобы показать вам, что вы хорошо разбираетесь в жизненном цикле проекта по науке о данных, а также в kaggle мы не моделируем часть развертывания.

В реальном мире данные время от времени меняются, мы должны знать, как обращаться с данными в это время и как выполнять оптимизацию модели.

Но делать проекты на kaggle и Hackathon — это хорошо, что делает вас сильнее в жизненном цикле проекта.

7. Большая часть времени проекта уходит на построение модели.

Это полный миф.

Поскольку вы знаете о шагах, связанных с проектом по науке о данных, вы можете увидеть затраты времени на эту работу сверху,

Большую часть времени специалист по данным тратит на очистку и организацию данных, что занимает около 60 % времени.

А время построения модели составляет менее 5%.

Итак, сделайте вывод, что большая часть времени не тратится на построение моделей.

8. Чтобы заниматься наукой о данных, вам нужно хорошо уметь программировать.

Это большой миф, в который верит большинство людей.

В настоящее время вам не нужно знать все о кодировании, есть больше открытых источников, доступных для легкого изучения, а также, когда вы застряли, легко погуглите и получите это.

Помните, что вам не нужно запоминать каждую кодировку, единственное, в чем вам нужно быть хорошим, — это построение логики.

9. Первокурсники не могут получить работу ИИ.

Что так неправда.

Если вы новичок, вам следует усердно работать над развитием своих навыков.

Выполните несколько проектов, чтобы получить практический опыт.

Подайте заявку на стажировку, используя полученные навыки, и докажите их.

Создайте сильное портфолио и попробуйте выполнить несколько сквозных проектов.

Единственное, что вы должны помнить, это постоянно выполнять тяжелую работу, и никто не может помешать вам получить работу.

Итак, это 9 моментов, которыми я хочу поделиться с вами, чтобы не отступайте от слышания этих мифов.

Последнее предложение с моей стороны: "Не переставайте учиться, учитесь постоянно. Это нормально - сталкиваться с отказами и неудачами вместо того, чтобы впадать в депрессию из-за них, старайтесь учиться на них и становиться сильнее".