Публикации по теме 'data-mining'


Очистка данных с помощью инструмента Rapid Miner Turbo Prep
Автор: Марсель Брито. Набор данных: болезни сердца из репозитория машинного обучения UCI Этот набор данных содержит наблюдения за 303 пациентами по 14 признакам, протестированным на наличие сердечных заболеваний у пациента из базы данных Кливленда. Процесс очистки данных очень важен в анализе данных и машинном обучении, потому что это шаг, который организует данные и предоставляет статистические методы для подбора лучшей модели, которая может привести к лучшей оценке. Поскольку данные..

Исследовательский анализ данных с Desbordante
Всем привет! Сегодня мы хотели бы поделиться с вами нашим инструментом профилирования данных. Ниже мы поговорим о самом профилировании данных, возможностях инструмента и о том, кому этот инструмент может быть полезен. Вы можете попробовать инструмент здесь . Введение Профилирование данных [1] — это процесс извлечения метаданных из данных. Это обычная задача для людей, работающих с данными, и их цели извлечения могут быть самыми разными. Что такое метаданные? В общем, это..

Почему Twitter такой удивительный набор данных для сентиментального анализа?
Почему Twitter такой удивительный набор данных для сентиментального анализа? Социальные сети являются очень популярными средствами массовой информации, где люди могут выражать свое мнение. На этих платформах можно найти мнения людей со всего мира, от политики до продуктов повседневного использования. Одной из таких социальных сетей является Twitter. Twitter отличается от своих современников двумя уникальными особенностями. 1. Политика 140 символов: Твиттер ограничивает количество..

О чем мы говорим, когда говорим о обогревателях
Приключения в интеллектуальном анализе данных Inspo Я учился в аспирантуре в Мельбурне, Виктория, Австралия, где я жил в двухэтажном кирпичном доме с террасой, построенном в викторианские времена. Я любил солнечный утренний кофе, летние «солнечные закуски» на террасе и удобное расположение этого красивого исторического дома, но я не любил зимний холод! Сорокаградусная погода в доме с высокими потолками и теплопоглощающими кирпичами придавала дому ощущение пещеры. Или..

Нарушение CAPTCHA: приложение для улучшения машинного обучения с помощью крупномасштабного графа
Вступление С ростом мощности компьютеров становится возможным создание сложных моделей и их обучение с использованием большого количества данных: вот почему большие данные и машинное обучение так популярны в наши дни. «Больше данных лучше, чем лучшие алгоритмы», наиболее распространенный способ улучшить модели машинного обучения - увеличить объем данных, чтобы они отражали разнообразие и выбросы, делая их менее предвзятыми. Среди популярных моделей записи данных просто используются как..

Понимание данных для науки о данных
Введение Прежде всего, чтобы понять Data Science, нужно понять данные . Но что такое данные? → Это набор объектов и атрибутов. Хорошо, что такое атрибуты? → Это свойства объекта. Пример: рост человека Для анализа атрибутов и объектов нам понадобится шкала измерений. Шкала измерения связывает числовые значения с атрибутами объекта. Пример: классифицируйте кого-либо как больного или здорового. Четыре свойства чисел используются для описания атрибутов: Отчетливость: =..

Правила ассоциации в машинном обучении и интеллектуальном анализе данных ??
Правила ассоциации можно рассматривать как отношение «если-то» . ARM (Association Rule Mining) — один из важных методов в науке о данных. В ARM частота шаблонов и ассоциаций в наборе данных определяется среди наборов элементов, а затем используется для прогнозирования следующего соответствующего элемента в наборе. Этот метод ARM в основном используется при принятии бизнес-решений в зависимости от покупок клиентов. Предположим, что товар A покупается покупателем, тогда выясняются шансы..