Подробный обзор одной из лучших книг по науке о данных

В этом обзоре мы рассмотрим следующие темы

Немного о себе

Стоит ли вам прочитать эту книгу?

Обзор

Немного о себе

Прежде чем я перейду к обзору этой книги, позвольте мне рассказать вам немного о себе. Я сертифицированный IBM специалист по науке о данных, практикующий специалист по науке о данных, работающий аналитиком данных в отрасли с более чем 35 сертификатами и проектами по науке о данных. Пройдя несколько курсов, я решил переключить свое внимание на чтение книг. Это первая книга, которую я прочитал в отношении науки о данных. Итак, давайте рассмотрим эту книгу!

Стоит ли вам прочитать эту книгу?

Если у вас мало или совсем нет знаний о слове наука о данных и вы хотите углубиться в эту область, эта книга для вас! Эта книга начнется с самых основ языка python, затем следует анализ с помощью python, затем визуализация данных и, наконец, машинное обучение с множеством мини-проектов, пока вы продолжаете читать.

Обзор

Должен сказать, что я прошел множество сертификаций по науке о данных на таких веб-сайтах, как Coursera, DataCamp, IBM Cognitive Class, Udemy и некоторых других веб-сайтах. Но когда я закончил читать эту книгу, я с трудом нашел темы, которые не были освещены в этой книге и были в курсах. Наоборот, из этой книги я узнал много нового.

Почему стоит прочитать эту замечательную книгу по науке о данных!

В этой книге предполагается, что у вас нет предварительных знаний в области науки о данных или программирования на Python. Эта книга проведет вас с нуля до человека, который может с помощью Python очищать данные, анализировать их, визуализировать, подготавливать данные для модели машинного обучения и применять к ним модель для прогнозирования.

Книга разделена на следующие разделы

  1. IPython (интерактивный Python)

Вы начнете с изучения IPython с самых основ с большим количеством примеров для практики. Вы изучите множество различных функций IPython, которые облегчат вам работу над проектом по науке о данных, таких как магические команды, ярлыки, отладка и многие другие

2. Numpy (библиотека для работы с массивами)

Numpy — это библиотека Python, обычно используемая людьми, работающими с данными в Python. Вы узнаете много способов работы с данными в python с помощью numpy. Вы узнаете о типах данных python, основах массивов numpy, вычислениях с массивами numpy, универсальных функциях, индексировании и нарезке с использованием numpy, агрегациях, широковещании, масках и многие другие элементы numpy. Вы получите достаточно знаний о numpy, чтобы начать эффективно анализировать данные.

3. Pandas (еще одна аналитическая библиотека Python)

Pandas — очень известная библиотека Python для анализа данных. Эта книга на примерах научит вас множеству различных методов анализа с использованием панд, включая, помимо прочего, введение в фреймы данных, индексирование и нарезку, обработку отсутствующих значений в данных, иерархическое индексирование, комбинирование наборы данных, агрегация и группировка, сводные таблицы, строковые операции, работа с временными рядами и многие другие полезные методы панд.

4. Визуализация данных

До сих пор вы бы изучили множество методов анализа данных. Теперь вы приступите к визуализации данных с помощью библиотек matplotlib и seaborn. Вы научитесь выбирать соответствующий тип техники визуализации в соответствии с имеющимися данными. Вы узнаете о многих различных типах визуализации, таких как линейные диаграммы, точечные диаграммы, гистограммы, тепловые карты, гистограммы, двухмерные графики, трехмерные графики, подграфики, стили и многие другие. Учитывая данные, вы сможете выбрать соответствующий тип диаграммы для ваших данных.

5. Машинное обучение

Наконец, теперь, когда вы освоились с анализом и визуализацией данных, ваши данные готовы для ввода в модель машинного обучения. Вы изучите различные типы методов машинного обучения, такие как обучение с учителем, обучение без учителя, кластеризация, разработка функций. Вы запачкаете руки, применяя многие алгоритмы машинного обучения, такие как линейная регрессия, наивный байесовский анализ, деревья решений, PCA (анализ основных компонентов), k-Means, оценка плотности ядра и некоторые другие. . Вы будете практически применять эти модели к различным наборам данных.

Заключение

В заключение я бы порекомендовал каждому новичку в науке о данных: если вы любите читать, эта книга ждет вас. Вы не почувствуете необходимости проходить множество онлайн-курсов. Эта книга поставит вас на путь науки о данных, и вы начнете анализировать различные наборы данных.

Предложения и отзывы будут оценены!

Спасибо за уделенное время