Что вызывает шумиху по поводу этого модного слова «Data Science»?

Наука о данных - это инструмент, который превращает данные в реальные действия. К ним относятся машинное обучение, технологии баз данных, статистика, программирование и предметно-ориентированные технологии.
Речь идет о продуктивном сборе, анализе, передаче и моделировании данных вокруг нас.
Наука о данных включает, экспериментирование, Исследовательский анализ, аналитика, бизнес-аналитика и т. Д., Наиболее популярными из которых являются машинное обучение и искусственный интеллект.

Машинное обучение и искусственный интеллект доминируют из-за тенденций, в которых все новые компании и стартапы хотят создать свою структуру или базу. Но крупные компании, такие как Google и Facebook, уже настолько хорошо себя зарекомендовали, что они хотят только улучшить каждый свой продукт и услугу.
Быть аналитиком данных - это не в том, насколько продвинута ваша модель, а в том, насколько сильно ее влияние вы создаете с помощью своей работы.
вы не только собираете данные, но и анализируете их, а также стратегии, чтобы решить проблемы или сделать продукт более доступным.
Это причина того, почему так много продуктовых компаний нанимают специалистов по анализу данных, потому что со всеми доступными сейчас ресурсами вы действительно можете радикально изменить отрасль.

Как им стать?

В современном мире Интернет - место хаоса. Есть много ресурсов, в которые можно погрузиться. Выбрать лучший курс и придерживаться его - самая сложная задача для всех. Я потратил так много времени на переключение между разными курсами и наконец почувствовал себя потерянным. Думаю, в настоящее время это происходит с каждым навыком, который вы хотите изучить. Таким образом, сложная задача не в том, чтобы научиться каким-либо навыкам, а в том, чтобы придерживаться одной хорошо спланированной и организованной траектории обучения.

С чего начать?

Программирование:

Нет необходимости говорить, что программирование - это фундаментальный навык не только для специалистов по данным, но и для любой работы, связанной не только с Tech World.
Теперь самый важный вопрос - над каким языком мы должны работать. Некоторые люди будут утверждать, что R так хорош в математическом моделировании. Я не возражаю, но наука о данных по-прежнему касается многого, НАМНОГО больше, чем математика и статистика. Python - это то, что даст вам больше возможностей при выполнении широкого спектра работ. С Python вы получите гораздо больше прибыли от вложений в обучение и сможете выполнять более широкий круг задач, таких как обработка данных и настройка веб-сервисов.
Еще одна причина, по которой я бы посоветовал Python, заключается в том, что с ним так легко учиться и осуществлять. Вы можете автоматизировать множество задач и делать с ним несколько интересных вещей.
Чтобы изучить синтаксис и познакомиться с ним, вы можете обратиться к Документам Python.
Некоторые книги: Изучите Python 3 The Hard Way , Автоматизируйте скучные вещи с помощью Python (эти книги сделают вас Богом Python, если вы их закончите.)
Я не совсем фанат читать книги и полагаться на то, чтобы изучать материал с помощью более интерактивных способов, таких как просмотр лекций или учебных пособий.
Вот некоторые ссылки для изучения Python:
- Введение в Python для науки о данных
- Программирование с Python для науки о данных

Познакомьтесь с Numpy, Pandas и Matplotlib. Узнайте, как загружать, обрабатывать и визуализировать данные. Владение этими библиотеками будет иметь решающее значение для ваших личных проектов. единственный способ изучить эти библиотеки - использовать их. Не думайте, что вам нужно запоминать каждое название метода или функции, это приходит с практикой. Если вы забудете, погуглите.

Подсказка: Python - довольно удивительный язык, и иногда он настолько ошеломляющий, что с его помощью можно делать почти все и вся. Совет - не тратить больше времени на изучение Python, вам нужно только ознакомиться с его синтаксисом. Наука о данных - это нечто большее.

Математика:

Математическая основа - ключевой навык, которым должен обладать каждый специалист по анализу данных. Вы даже не сможете частично разобраться в проблеме, если у вас нет необходимых навыков.
Статистика, теория вероятностей и линейная алгебра - необходимое условие для всей работы по машинному обучению и анализу данных. К счастью, считается, что индийцы очень хороши в математике. Если у вас уже есть твердое понимание, потратьте неделю или две на уточнение ключевых понятий. Особенно внимательно относитесь к описательной статистике. Умение понимать набор данных - это умение на вес золота.
Вот некоторые из полезных ссылок:
- Статистика и вероятность
- Линейная алгебра
- Многопараметрическое исчисление

Машинное обучение:

Теперь, когда вы изучили основную математику науки о данных, вы сможете глубоко понимать различные алгоритмы машинного обучения.
Эти алгоритмы нужны вам для получения аналитических данных, корреляций, классификации и кластеризации данных.
Эти алгоритмы помогут вам понять, как можно решить реальную проблему и как в соответствии с этим можно анализировать и обрабатывать данные. Эти алгоритмы похожи на оружие для решения таких огромных проблем с огромными данными. Несмотря на то, что после небольшой работы над некоторыми проектами может быть несколько подходов к решению проблемы, вы будете иметь довольно хорошее представление о том, какой алгоритм использовать в каком случае.
Вот несколько полезных руководств:
- Learning From Data (Вводное машинное обучение)
- Машинное обучение (Один из лучших курсов, рекомендуемых всеми) (Автор: Эндрю Нг)
Некоторые из примеров наборов данных, с которыми можно поиграть: Репозиторий машинного обучения
В документации Scikit-learn есть отличные руководства по применению распространенных алгоритмов.

Ознакомившись с различными алгоритмами машинного обучения, вы можете продолжить изучение некоторых методов глубокого обучения. занимается алгоритмами, основанными на структуре и функциях мозга, которые называются искусственными нейронными сетями. Вам будет интереснее, если вы углубитесь в это.
- Deep Learning
- Deep Learning Book

База данных:

Научиться работать с базами данных необходимо, поскольку данные, с которыми вы будете работать, в конечном итоге будут там храниться. Таким образом, манипуляции с базами данных - необходимый набор навыков для любого специалиста по данным, работающего в отрасли. Вы можете получить дополнительные преимущества, если узнаете, как настраивать эти базы данных и управлять ими на облачном сервере.
Для этого доступны различные курсы:
- Введение в базы данных

Различные инструменты для больших данных:
- Hadoop
- Hadoop & Map Reduce

Последний совет:

Обучение онлайн - непростая задача, и с таким огромным количеством ресурсов очень легко отвлечься от обучения онлайн. Наука о данных - это другой путь, отличный от всех областей компьютерных наук, и в какой-то момент вы будете разочарованы тем, что потратили все свое время на их изучение, а ваш результат равен нулю. Но не расстраивайтесь по этому поводу, Data Science похож на марафон, и вам в конечном итоге придется потратить много времени на это, оставив все остальные области. Вы почувствуете, что ваши друзья и коллеги, изучающие разные вещи, намного опережают вас. Но после самообразования и регулярно организованного вложения времени вы в конечном итоге окажетесь на другом уровне, чем любой из ваших соперников. Это будет непросто, но для мотивации к собственному обучению вам потребуются настойчивость и дисциплина. Тогда вы сможете ворваться в отрасль науки о данных, в какой бы ситуации вы ни находились.

Не соглашайтесь только на изучение концепции, а затем переходите к следующему. Процесс обучения не прекращается, пока вы не примените концепцию в реальном мире. Работайте над некоторыми проектами, чтобы реализовать эти вещи. Kaggle предлагает множество различных ресурсов и конкурсов, чтобы применить свои знания в некоторых реальных проектах и ​​извлечь из них уроки.
Вы почувствуете огромную мотивацию, когда сможете решить эти проблемы, и кто знает, что вы можете выиграйте и денежные призы!

Применение науки о данных безгранично. Это процесс обучения на протяжении всей жизни, так что наслаждайтесь своим образовательным и приключенческим путешествием, чтобы повлиять на реальный мир и сделать этот мир лучше.
Я желаю вам всего наилучшего в вашем прекрасном предстоящем будущем, как специалист по данным.

Хотите подключиться?
Github | LinkedIn | Твиттер | Facebook | Quora