Публикации по теме 'statistical-analysis'


Структура многомерных данных
Структура многомерных данных Хороший пост. Я хотел бы узнать мнение вашего эксперта о следующих инструментах, которые я лично использую для понимания многомерных данных: анализ множественных соответствий, предпочтительно в сочетании с иерархической кластеризацией для отображения и визуализации корреляций и, возможно, зависимостей; Изучение байесовской структуры, в частности, с помощью поиска Табу и деревьев Чоу-Лю, в основном рассматривая результирующие неориентированные графы (с..

Машинное обучение: проблема дисбаланса меток целевых функций и решения
"Начиная" Машинное обучение: проблемы с дисбалансом меток целевых функций и решения Оглавление Часть 1: Концепции "Вступление" Что такое данные поезда? Зачем нужно балансировать данные поездов? Как на самом деле выглядят« данные балансировки ?» Нам также нужно сбалансировать тестовые данные? Метрики оценки несбалансированных данных испытаний Часть 2: Код "Настраивать" Проектирование начальных характеристик Трансформация цели модели Обращение к..

Реализация гауссовского наивного байесовского метода в Python с нуля
Учиться, кодировать и выполнять… Наивный байесовский алгоритм - очень удобный, популярный и важный алгоритм машинного обучения, особенно для текстовой аналитики и общей классификации. Он имеет множество различных конфигураций, а именно: Гауссовский наивный байесовский Полиномиальный наивный байесовский Дополнение наивного Байеса Бернулли Наивный Байес Внеядерный наивный байесовский В этой статье я собираюсь обсудить гауссовский наивный байесовский алгоритм: алгоритм, его..

Все вкратце о линейной регрессии
Что вы думаете, когда кто-то спрашивает вас о линейной регрессии? Вы когда-нибудь думали об этом? Пытались обрамлять свои ответы в той ситуации или ломали голову? Что ж, это слишком сложно, потому что кто-то задает вам только один вопрос, и вы получаете в голову внешние странные вопросы, потому что вы слишком запутались, чтобы сформулировать ответы на этот вопрос. Итак, давайте посмотрим, что такое линейная регрессия, простыми словами и понятным образом, чтобы в следующий раз, если..

Центральная предельная теорема (ЦПТ)
Центральная предельная теорема утверждает, что выборочное распределение средних значений выборки приближается к нормальному распределению, поскольку размер выборки увеличивается независимо от формы распределения генеральной совокупности. Этот факт соответствует размеру каждой выборки более 30. Центральная предельная теорема (CLT) в основном утверждает, что для ненормальных данных распределение выборочных средних имеет приблизительное нормальное распределение, независимо от того, как..

Руководство для начинающих по теории вероятностей и статистике в области науки о данных
Вы когда-нибудь задумывались, почему изучение и понимание математических понятий, таких как вероятность и статистика, важно для специалиста по данным? Вы когда-нибудь задумывались, почему изучение и понимание математических понятий, таких как вероятность и статистика, важно для специалиста по данным? Считается, что большая часть работы в области науки о данных сводится исключительно к программированию, но почти все, что делают специалисты по данным, связано со статистикой и..

Корреляция - статистический анализ!
Самый важный шаг в компьютерном зрении или машинном обучении - хорошо понимать данные и использовать эти знания для выбора наилучшего дизайна. Открытый вопрос .. Как хорошо понимать данные? Ответ заключается в применении статистических методов ... Следовательно, красная тема этого урока - понять самый важный статистический метод, то есть корреляцию. Слово корреляция используется в повседневной жизни для обозначения некоторой формы ассоциации. Это статистический метод, который..