Подробный обзор одной из лучших книг по науке о данных
В этом обзоре мы рассмотрим следующие темы
Немного о себе
Стоит ли вам прочитать эту книгу?
Обзор
Немного о себе
Прежде чем я перейду к обзору этой книги, позвольте мне рассказать вам немного о себе. Я сертифицированный IBM специалист по науке о данных, практикующий специалист по науке о данных, работающий аналитиком данных в отрасли с более чем 35 сертификатами и проектами по науке о данных. Пройдя несколько курсов, я решил переключить свое внимание на чтение книг. Это первая книга, которую я прочитал в отношении науки о данных. Итак, давайте рассмотрим эту книгу!
Стоит ли вам прочитать эту книгу?
Если у вас мало или совсем нет знаний о слове наука о данных и вы хотите углубиться в эту область, эта книга для вас! Эта книга начнется с самых основ языка python, затем следует анализ с помощью python, затем визуализация данных и, наконец, машинное обучение с множеством мини-проектов, пока вы продолжаете читать.
Обзор
Должен сказать, что я прошел множество сертификаций по науке о данных на таких веб-сайтах, как Coursera, DataCamp, IBM Cognitive Class, Udemy и некоторых других веб-сайтах. Но когда я закончил читать эту книгу, я с трудом нашел темы, которые не были освещены в этой книге и были в курсах. Наоборот, из этой книги я узнал много нового.
Почему стоит прочитать эту замечательную книгу по науке о данных!
В этой книге предполагается, что у вас нет предварительных знаний в области науки о данных или программирования на Python. Эта книга проведет вас с нуля до человека, который может с помощью Python очищать данные, анализировать их, визуализировать, подготавливать данные для модели машинного обучения и применять к ним модель для прогнозирования.
Книга разделена на следующие разделы
- IPython (интерактивный Python)
Вы начнете с изучения IPython с самых основ с большим количеством примеров для практики. Вы изучите множество различных функций IPython, которые облегчат вам работу над проектом по науке о данных, таких как магические команды, ярлыки, отладка и многие другие
2. Numpy (библиотека для работы с массивами)
Numpy — это библиотека Python, обычно используемая людьми, работающими с данными в Python. Вы узнаете много способов работы с данными в python с помощью numpy. Вы узнаете о типах данных python, основах массивов numpy, вычислениях с массивами numpy, универсальных функциях, индексировании и нарезке с использованием numpy, агрегациях, широковещании, масках и многие другие элементы numpy. Вы получите достаточно знаний о numpy, чтобы начать эффективно анализировать данные.
3. Pandas (еще одна аналитическая библиотека Python)
Pandas — очень известная библиотека Python для анализа данных. Эта книга на примерах научит вас множеству различных методов анализа с использованием панд, включая, помимо прочего, введение в фреймы данных, индексирование и нарезку, обработку отсутствующих значений в данных, иерархическое индексирование, комбинирование наборы данных, агрегация и группировка, сводные таблицы, строковые операции, работа с временными рядами и многие другие полезные методы панд.
4. Визуализация данных
До сих пор вы бы изучили множество методов анализа данных. Теперь вы приступите к визуализации данных с помощью библиотек matplotlib и seaborn. Вы научитесь выбирать соответствующий тип техники визуализации в соответствии с имеющимися данными. Вы узнаете о многих различных типах визуализации, таких как линейные диаграммы, точечные диаграммы, гистограммы, тепловые карты, гистограммы, двухмерные графики, трехмерные графики, подграфики, стили и многие другие. Учитывая данные, вы сможете выбрать соответствующий тип диаграммы для ваших данных.
5. Машинное обучение
Наконец, теперь, когда вы освоились с анализом и визуализацией данных, ваши данные готовы для ввода в модель машинного обучения. Вы изучите различные типы методов машинного обучения, такие как обучение с учителем, обучение без учителя, кластеризация, разработка функций. Вы запачкаете руки, применяя многие алгоритмы машинного обучения, такие как линейная регрессия, наивный байесовский анализ, деревья решений, PCA (анализ основных компонентов), k-Means, оценка плотности ядра и некоторые другие. . Вы будете практически применять эти модели к различным наборам данных.
Заключение
В заключение я бы порекомендовал каждому новичку в науке о данных: если вы любите читать, эта книга ждет вас. Вы не почувствуете необходимости проходить множество онлайн-курсов. Эта книга поставит вас на путь науки о данных, и вы начнете анализировать различные наборы данных.
Предложения и отзывы будут оценены!
Спасибо за уделенное время