Публикации по теме 'data-analytics'


Оптимальный порог для несбалансированной классификации
Практическое руководство Оптимальный порог для несбалансированной классификации Как выбрать оптимальный порог с помощью кривой ROC и кривой Precision-Recall Несбалансированная классификация Классификация - это один из методов обучения с учителем для проведения прогнозной аналитики с категориальным результатом, это может быть бинарный или мультиклассовый класс. В настоящее время проводится множество исследований и примеров классификации с использованием нескольких алгоритмов, от..

Превзойдите конкурентный рынок макадамии с помощью данных дронов
Ни для кого не секрет, что орехи макадамии быстро становятся ведущей культурой в ЮАР. Урожайность орехов макадамия составляет 374 000 рандов с гектара, и они особенно прибыльны, а на современном конкурентном рынке важно превосходное управление урожаем. Чтобы защитить ваши инвестиции, Aerobotics предлагает изображения с дронов с высоким разрешением и передовые алгоритмы, чтобы гарантировать, что ваши культуры сохранят свое качество и ценность. Одним из преимуществ данных с дронов..

Как освоить SQL бесплатно с открытым исходным кодом
Полное руководство для начинающих по MySQL с открытым исходным кодом Для всех, кто работает с данными (а это, по крайней мере, я слышал - все ), SQL - один из тех навыков, которые действительно могут сдвинуть горы. Если на вашем рабочем месте используется SQL, его изучение может кардинально изменить вашу карьеру к лучшему. Хотя он используется повсюду, он тоже может стоить дорого. Многие компании, в которых я работал или с которыми я работал, использовали одно из следующего:..

Различные типы недостающих данных.
Отсутствие данных - одна из распространенных проблем, с которой согласятся и специалисты в области науки о данных или аналитики. Статистически существует три различных типа отсутствующих данных (а именно MCAR, MAR, MNAR), но в реальных данных может быть обнаружен 4-й тип отсутствующих данных, который называется структурированными отсутствующими данными. Давайте разберемся с каждым из них по отдельности: 1.Структурированные отсутствующие данные: - Данные, которые отсутствуют..

Подход к науке о данных — Стратегии и советы, которые помогут вам начать работу
Подход Data Science — стратегии и советы, которые помогут вам начать работу Как профессионалы в области технологий, мы постоянно стремимся расширять границы инноваций, применяя наши навыки для улучшения продукта или услуги в наших соответствующих организациях. Наука о данных, одна из самых быстрорастущих областей в последнее время, использует научные методы, процессы, алгоритмы и системы для извлечения информации из данных. Будучи студентом по аналитике данных в Университете Колорадо..

Деревья решений
Проблема классификации Во входящем наборе данных каждый экземпляр описывается как набор атрибутов и одна специальная метка класса. Проблема классификации — это задача найти модель, которая может правильно предсказать метку класса на основе значений различных атрибутов. Дерево решений Дерево решений можно определить с точки зрения его четырех компонентов: 1. Корневой узел: это точка доступа к дереву решений. 2. Ветвь: соединение между двумя узлами 3. Лист: конечный узел или..

Анализ данных для сетевой безопасности с использованием Julia — Часть 2
Это вторая часть блога, демонстрирующая элементарный анализ данных для сетевой безопасности на синтетическом наборе данных из Wildcard 400–2019 Trendmicro CTF . Первую часть вы можете найти здесь . Вопрос 4. Частный канал управления и контроля У нас всегда низкосортная инфекция; на некоторых внутренних машинах всегда будет какое-то вредоносное ПО. Некоторые из этих зараженных хостов звонят домой в C&C по частному каналу. Какой уникальный порт используется внешним вредоносным ПО..