Если вы ищете достойный старт в науке о данных. Затем эта страница предоставит вам структуру курса и ссылки на ресурсы. Изучите основные понятия, чтобы попасть в мир науки о данных.

Пролог. Обмен знаниями должен быть бесплатным, в Интернете более чем достаточно ресурсов для изучения науки о данных бесплатно. Для доступа к приведенным ниже ссылкам и ресурсам может потребоваться регистрация. для курсов, которые являются бесплатными.

Курс машинного обучения от Andrew NG:

Примечание. Это лучший курс в Интернете, который дает представление о машинном обучении и линейной алгебре, а также подробно охватывает все области и может потребовать ваших усилий при отправке задания.

Ссылка на курс или (https://www.coursera.org/learn/machine-learning)

Подробности. Приведенная выше ссылка на курс охватывает все основные концепции машинного обучения и практические задания.

Курс основан на использовании Octave/Matlab, потому что на данный момент понимание математических обозначений в Octave/Matlab будет проще, чем в Python/R.

Темы охватывали:

  1. Линейная алгебра: матрицы, векторы и операции.
  2. Линейная регрессия: представление модели, функция стоимости, градиентный спуск.
  3. Линейная регрессия Несколько переменных: градиентный спуск для нескольких функций, функции для полиномиальной регрессии.
  4. Логистическая регрессия: классификация, представление гипотезы, граница решения, функция стоимости и градиентный спуск, расширенная оптимизация, многоклассовая классификация.
  5. Регуляризация: понимание переобучения, функция стоимости, регуляризованная линейная функция, регуляризованная логистическая функция.
  6. Введение в нейронные сети: интуиция нейронных сетей и представление модели.

Другие материалы:

Google также предоставляет руководство для самостоятельного обучения с видео, а также материалы курса с краткими примерами.

Ссылка: https://developers.google.com/machine-learning/crash-course/ml-intro

Ресурс Google будет очень полезен для доработки и уточнения.

Вышеупомянутые 2 ресурса обеспечат очень хорошую основу для машинного обучения и науки о данных.

Мифы о науке о данных:

  1. Наука о данных не требует навыков программирования или кодирования. большая часть кода уже написана в модулях, просто нужно реализовать с помощью API и понять алгоритм.
  2. Не нужно быть профессионалом в статистике и математике. Базовой математики и линейной алгебры, которой учатся в школе, будет достаточно.
  3. Не требует машин высокой конфигурации. Большинство наборов данных для практики достаточно малы и в них будет легко разобраться в закономерностях.
  4. Не обязательно быть выпускником компьютерных наук. Наука о данных не зависит от предметной области, она затрагивает все области.
  5. Не нужно тратить много денег, чтобы изучать науку о данных. Большинство лучших руководств бесплатны и доступны в Интернете.

Вышеупомянутое — это только мифы, а их наличие — только дополнение.

Ссылки на полезные ресурсы:

Если вы новичок в программировании, я бы посоветовал изучить базовые языки программирования, такие как C/Java/Python, и концепции объектно-ориентированного программирования, которые облегчат вам понимание уже созданных модулей.

Google предоставляет бесплатный курс по Python, содержащий видео и материалы, которые охватывают большинство концепций Python, таких как:

Типы данных, строки, списки, сортировки, словари, файлы, регулярные выражения, утилиты.

Ссылка: https://developers.google.com/edu/python/

Эта статья содержит только ссылки на ресурсы и введение в науку о данных. Будет опубликована еще одна статья, которая будет содержать весь список концепций машинного обучения для краткого обзора.

Далее:

  1. Аналитика в реальном времени и наборы данных.
  2. Практика с наборами данных на Kaggle.
  3. Более глубокое погружение в машинное обучение.
  4. Нейронные сети и глубокое обучение.