Публикации по теме 'exploratory-data-analysis'


Визуализация YouTube Trending с использованием Python
Всем привет! Я провел исследовательский анализ данных и визуализацию для набора данных YouTube Trending Videos в США, используя Python. Коды будут выше соответствующих описаний для всех моих шагов. Посмотрим, что я нашел! from google.colab import files uploaded = files.upload() import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plot df = pd.read_csv(‘US_youtube_trending_data.csv’) df.head(3) df.tail(3) df.shape Я начал с загрузки набора данных и..

Полное руководство по NumPy для науки о данных
Руководство по изучению и внедрению NumPy от начального до продвинутого уровня для исследовательского анализа данных при работе с данными. Что такое NumPy? NumPy - это библиотека Python, которая поможет в анализе данных. Он используется людьми, которые занимаются наукой о данных. Это библиотека линейной алгебры, которая имеет привязки к библиотекам C, что делает ее очень быстрой. Как установить NumPy? Чтобы установить NumPy с помощью pip: pip install numpy Чтобы установить..

Фейковые новости — Анализ данных и прогнозы с помощью машинного обучения
Правда о фейковых новостях Текст и метаданные из фальшивых и предвзятых источников новостей в Интернете Можно ли обнаружить фальшивые новости на основе определенных признаков, указывающих на то, что новости ненастоящие, и как они могут быть подкреплены доказательствами? Произошла вспышка фейковых новостей, поскольку мир вступает в эпоху пандемии, когда источником информации для большинства людей во всем мире был Интернет. Поддельные новости могут включать в себя мнения, слухи и..

Прогнозирование сердечно-сосудистых заболеваний с помощью машинного обучения
Основная цель этого проекта — предсказать, есть ли у пациента заболевание сердца или нет, при наличии некоторых клинических параметров. В этой статье мы рассмотрим проблему классификации сердечных заболеваний в отношении различных клинических параметров, которые являются различными характеристиками, и попробуем предсказать, с большей вероятностью у пациента будет сердечная недостаточность или нет, используя алгоритмы машинного обучения. Я разделил работу на 2 части, где часть 1 включает в..

Исследовательский анализ данных (EDA) по набору данных о диабете
EDA играет решающую роль в построении любой модели данных. Не существует единого способа выполнить EDA для набора данных. Как следует из названия, мы должны исследовать различные способы, чтобы найти закономерности в данных и прийти к осмысленным выводам. Давайте начнем проводить EDA по очень серьезной проблеме, с которой сегодня сталкивается мир. ДИАБЕТ. Более 88 миллионов взрослых жителей США — более трети — страдают преддиабетом, и более 84 % из них не знают, что он у него есть...

Обнаружение пульсаров, настройка гиперпараметров и визуализация
Откройте для себя возможности Yellowbrick и расширьте возможности! Пульсары - это сильно намагниченные вращающиеся нейтронные звезды, испускающие пучки электромагнитного излучения из своих магнитных полюсов. Пульсары - один из кандидатов на роль источника космических лучей сверхвысокой энергии. Они важны, поскольку помогают изучать экстремальные состояния материи, искать экзопланеты, измерять космические расстояния и находить гравитационные волны. Мы проведем классификацию..

Как аналитика данных используется для осмысления данных
Исследовательский анализ соискателей кредита с использованием немецкого набора кредитных данных Введение Аналитика данных — это процесс анализа необработанных данных с целью получения информации и выводов о данных. Аналитика данных — важная область науки о данных, поскольку она помогает предприятиям оптимизировать свою работу. Аналитика данных помогает предприятиям сократить расходы и повысить общую эффективность бизнеса. Когда банк получает заявку на получение кредита, банк..