Публикации по теме 'exploratory-data-analysis'
Визуализация YouTube Trending с использованием Python
Всем привет! Я провел исследовательский анализ данных и визуализацию для набора данных YouTube Trending Videos в США, используя Python.
Коды будут выше соответствующих описаний для всех моих шагов. Посмотрим, что я нашел!
from google.colab import files
uploaded = files.upload()
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plot
df = pd.read_csv(‘US_youtube_trending_data.csv’)
df.head(3)
df.tail(3)
df.shape
Я начал с загрузки набора данных и..
Полное руководство по NumPy для науки о данных
Руководство по изучению и внедрению NumPy от начального до продвинутого уровня для исследовательского анализа данных при работе с данными.
Что такое NumPy?
NumPy - это библиотека Python, которая поможет в анализе данных. Он используется людьми, которые занимаются наукой о данных. Это библиотека линейной алгебры, которая имеет привязки к библиотекам C, что делает ее очень быстрой.
Как установить NumPy?
Чтобы установить NumPy с помощью pip:
pip install numpy
Чтобы установить..
Фейковые новости — Анализ данных и прогнозы с помощью машинного обучения
Правда о фейковых новостях Текст и метаданные из фальшивых и предвзятых источников новостей в Интернете
Можно ли обнаружить фальшивые новости на основе определенных признаков, указывающих на то, что новости ненастоящие, и как они могут быть подкреплены доказательствами?
Произошла вспышка фейковых новостей, поскольку мир вступает в эпоху пандемии, когда источником информации для большинства людей во всем мире был Интернет. Поддельные новости могут включать в себя мнения, слухи и..
Прогнозирование сердечно-сосудистых заболеваний с помощью машинного обучения
Основная цель этого проекта — предсказать, есть ли у пациента заболевание сердца или нет, при наличии некоторых клинических параметров.
В этой статье мы рассмотрим проблему классификации сердечных заболеваний в отношении различных клинических параметров, которые являются различными характеристиками, и попробуем предсказать, с большей вероятностью у пациента будет сердечная недостаточность или нет, используя алгоритмы машинного обучения. Я разделил работу на 2 части, где часть 1 включает в..
Исследовательский анализ данных (EDA) по набору данных о диабете
EDA играет решающую роль в построении любой модели данных. Не существует единого способа выполнить EDA для набора данных. Как следует из названия, мы должны исследовать различные способы, чтобы найти закономерности в данных и прийти к осмысленным выводам.
Давайте начнем проводить EDA по очень серьезной проблеме, с которой сегодня сталкивается мир.
ДИАБЕТ. Более 88 миллионов взрослых жителей США — более трети — страдают преддиабетом, и более 84 % из них не знают, что он у него есть...
Обнаружение пульсаров, настройка гиперпараметров и визуализация
Откройте для себя возможности Yellowbrick и расширьте возможности!
Пульсары - это сильно намагниченные вращающиеся нейтронные звезды, испускающие пучки электромагнитного излучения из своих магнитных полюсов. Пульсары - один из кандидатов на роль источника космических лучей сверхвысокой энергии. Они важны, поскольку помогают изучать экстремальные состояния материи, искать экзопланеты, измерять космические расстояния и находить гравитационные волны.
Мы проведем классификацию..
Как аналитика данных используется для осмысления данных
Исследовательский анализ соискателей кредита с использованием немецкого набора кредитных данных
Введение
Аналитика данных — это процесс анализа необработанных данных с целью получения информации и выводов о данных. Аналитика данных — важная область науки о данных, поскольку она помогает предприятиям оптимизировать свою работу. Аналитика данных помогает предприятиям сократить расходы и повысить общую эффективность бизнеса.
Когда банк получает заявку на получение кредита, банк..