Наука о данных, Мнение

Нет ничего лучше, чем «гражданский специалист по данным»

Стратегия преодоления трудностей в области науки о данных

Уважаемый начинающий специалист по данным!

Прежде чем вы начнете использовать инструменты анализа данных «low code» или «drag & drop», пожалуйста, изучите основы.

Зачем стремиться стать «гражданином-специалистом по данным», если вы действительно можете стать «специалистом по данным».

Не поддавайтесь модным названиям вроде «Citizen Data Scientist». Забавно, что в науке о данных происходит так много продаж.

Я имею в виду, если мы знаем, как пользоваться термометром или работать с аппаратом ВР, должны ли мы называть себя «Гражданином Доктором»?

Стратегия - подорвать трудности в науке о данных!

Подрывать трудности в науке о данных вредно. Многие продавцы «стать специалистом по анализу данных на месячном курсе» и продавцы «решения для анализа данных с низким кодом» используют эту стратегию.

Продавцы «решения с низким кодом / без кода» часто утверждают, что интуицию можно получить, * делая * что-то. Контраргумент против этого заключается в том, что использование решения с низким кодом / без кода похоже на использование калькулятора. Чтобы научиться пользоваться калькулятором, необходимо иметь навыки счета. Изучение основ науки о данных похоже на приобретение навыков счета.

Почему 85% проектов Data Science терпят неудачу? (подсказка: в игре нет скина)

85% проектов Data Science терпят неудачу на предприятии, потому что люди думают, что заниматься наукой о данных легко, но делают это неправильно. Осознание часто приходит поздно.

Многие становятся жертвами «стать специалистом по анализу данных за 1 месяц / 6 месяцев типовых курсов» и часто задаются вопросом, почему их не нанимают.

Рынок - крайний свидетель правды.

Он каким-то образом знает, кто такие хорошие игроки, и использует отличный механизм фильтрации. Причина в том, что рынок состоит из компаний, у которых есть «шкура в игре».

Компании, у которых есть «шкура в игре», не играют. Они нанимают настоящих талантов. Простой тест «скин в игре», который можно сделать самостоятельно, - это задать один простой вопрос. Могу ли я сам пользоваться классификатором машинного обучения?

Я наткнулся на сообщение в Linkedin, где человек построил модель прогнозирования сердечных заболеваний, используя одну из библиотек с низким кодом. Настоящий вопрос заключается в том, будет ли этот человек использовать эту модель для своих близких и родственников?

Кроме того, реальная полезность предсказания сердечных заболеваний или землетрясений заключается не в предсказании того, что это произойдет с вероятностью x%, а в том, чтобы КОГДА это случиться.

Эту «временную» часть никакая модель не может точно предсказать.

Заниматься наукой о данных легко. Либо это?

Одна из причин, по которой наука о данных кажется * простой *, заключается в том, что многие алгоритмы можно уместить в 2–3 строчки кода. Просто нет интеллектуальной боли.

Сравните это с программированием. Человек должен подумать о синтаксисе, шаблоне проектирования и логике. Когда что-то сбивается с пути в программировании, существует несколько контрольных точек в виде предупреждений об ошибках, таких как время выполнения, синтаксическая ошибка и ошибка компилятора. Каждый получает немедленную проверку реальности, насколько он хороший или плохой программист. В результате никто не поднимается и о том, чтобы называть себя «гражданским инженером-программистом».

С другой стороны, когда дело доходит до науки о данных, не существует эквивалента ошибок времени выполнения или синтаксических ошибок. Нет никаких предупреждающих знаков, говорящих о том, что нельзя применить определенный алгоритм к данным. Не существует немедленной реальности проверки данных на основе данных.

Это одна из причин, по которой люди, которые выступают за «изучение основ не важно», остаются безнаказанными. Вот почему возникают такие причудливые, но вредные названия, как «ученый-гражданин».

Вышеупомянутая критика может показаться грубой / горькой, но все это сделано в надежде, что однажды мы все сможем сказать, что 85% проектов Data Science скорее увенчаются успехом, чем потерпят неудачу.

Я также рекомендую читателям прочитать следующие статьи:





« Ученый с нулевым стеком - Часть I, начало
Мы живем в эпоху неопределенности. Неизвестно, как будет развиваться экономика после COVID-19 (быстрое / медленное восстановление… medium.com »



Ваши комментарии и отзывы приветствуются.

Вы можете связаться со мной по

Linkedin

Твиттер