Если вы ищете достойный старт в науке о данных. Затем эта страница предоставит вам структуру курса и ссылки на ресурсы. Изучите основные понятия, чтобы попасть в мир науки о данных.
Пролог. Обмен знаниями должен быть бесплатным, в Интернете более чем достаточно ресурсов для изучения науки о данных бесплатно. Для доступа к приведенным ниже ссылкам и ресурсам может потребоваться регистрация. для курсов, которые являются бесплатными.
Курс машинного обучения от Andrew NG:
Примечание. Это лучший курс в Интернете, который дает представление о машинном обучении и линейной алгебре, а также подробно охватывает все области и может потребовать ваших усилий при отправке задания.
Ссылка на курс или (https://www.coursera.org/learn/machine-learning)
Подробности. Приведенная выше ссылка на курс охватывает все основные концепции машинного обучения и практические задания.
Курс основан на использовании Octave/Matlab, потому что на данный момент понимание математических обозначений в Octave/Matlab будет проще, чем в Python/R.
Темы охватывали:
- Линейная алгебра: матрицы, векторы и операции.
- Линейная регрессия: представление модели, функция стоимости, градиентный спуск.
- Линейная регрессия Несколько переменных: градиентный спуск для нескольких функций, функции для полиномиальной регрессии.
- Логистическая регрессия: классификация, представление гипотезы, граница решения, функция стоимости и градиентный спуск, расширенная оптимизация, многоклассовая классификация.
- Регуляризация: понимание переобучения, функция стоимости, регуляризованная линейная функция, регуляризованная логистическая функция.
- Введение в нейронные сети: интуиция нейронных сетей и представление модели.
Другие материалы:
Google также предоставляет руководство для самостоятельного обучения с видео, а также материалы курса с краткими примерами.
Ссылка: https://developers.google.com/machine-learning/crash-course/ml-intro
Ресурс Google будет очень полезен для доработки и уточнения.
Вышеупомянутые 2 ресурса обеспечат очень хорошую основу для машинного обучения и науки о данных.
Мифы о науке о данных:
- Наука о данных не требует навыков программирования или кодирования. большая часть кода уже написана в модулях, просто нужно реализовать с помощью API и понять алгоритм.
- Не нужно быть профессионалом в статистике и математике. Базовой математики и линейной алгебры, которой учатся в школе, будет достаточно.
- Не требует машин высокой конфигурации. Большинство наборов данных для практики достаточно малы и в них будет легко разобраться в закономерностях.
- Не обязательно быть выпускником компьютерных наук. Наука о данных не зависит от предметной области, она затрагивает все области.
- Не нужно тратить много денег, чтобы изучать науку о данных. Большинство лучших руководств бесплатны и доступны в Интернете.
Вышеупомянутое — это только мифы, а их наличие — только дополнение.
Ссылки на полезные ресурсы:
Если вы новичок в программировании, я бы посоветовал изучить базовые языки программирования, такие как C/Java/Python, и концепции объектно-ориентированного программирования, которые облегчат вам понимание уже созданных модулей.
Google предоставляет бесплатный курс по Python, содержащий видео и материалы, которые охватывают большинство концепций Python, таких как:
Типы данных, строки, списки, сортировки, словари, файлы, регулярные выражения, утилиты.
Ссылка: https://developers.google.com/edu/python/
Эта статья содержит только ссылки на ресурсы и введение в науку о данных. Будет опубликована еще одна статья, которая будет содержать весь список концепций машинного обучения для краткого обзора.
Далее:
- Аналитика в реальном времени и наборы данных.
- Практика с наборами данных на Kaggle.
- Более глубокое погружение в машинное обучение.
- Нейронные сети и глубокое обучение.