Публикации по теме 'statistical-analysis'


Нормальное распределение и машинное обучение
Нормальное распределение - важное понятие в статистике и основа машинного обучения. Специалист по анализу данных должен знать о нормальном распределении, когда он работает с линейными моделями (хорошо работают, если данные распределяются нормально), центральной предельной теореме и исследовательском анализе данных. Как обнаружил Карл Фридрих Гаусс , Нормальное распределение / Гауссово распределение представляет собой непрерывное распределение вероятностей. Он имеет колоколообразную..

PCA (анализ основных компонентов)
Анализ основных компонентов — это алгоритм машинного обучения без учителя, метод уменьшения размерности и снижения сложности. Обратная сторона этого алгоритма заключается в вычислении собственного вектора. Схема программного обеспечения PCA выглядит следующим образом. Если вы учитесь в среде MATLAB, вы можете использовать «eigs(A)», которые вычисляют отсортированные собственные векторы и собственное значение. Кроме того, «np.linalg.eig(cov)» используется для сортировки собственных..

ПРИМЕНЕНИЕ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ ДЛЯ БИЗНЕС-ИНСАЙТОВ
ПРИМЕНЕНИЕ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ ДЛЯ БИЗНЕС-ИНСАЙТОВ КРАТКОЕ ОБЗОР ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ И ЕЕ ПРЕДПОЛОЖЕНИЕ Когда зависимая переменная является категориальной или бинарной по форме, логистическая регрессия представляет собой статистический метод, используемый для изучения связи между зависимой переменной и одной или несколькими независимыми переменными. В обобщенной линейной модели, известной как логистическая регрессия, связь между независимыми и зависимыми переменными..

Уменьшение размерности — Кто делает это лучше?
Введение Для обучения модели машинного обучения на больших наборах данных требуется много вычислительных ресурсов , а также слишком много времени . Чтобы достичь конечной цели в реалистичные сроки, важно подумать о способах предварительной обработки набора данных таким образом, чтобы сократить объем вычислений и обеспечить масштабируемость. Именно здесь на помощь приходят методы уменьшения размерности . Понижение размерности сопоставляет многомерный набор данных с более низким..

Почему R является обязательным для каждого начинающего аналитика данных
Раскрытие возможностей R для анализа и визуализации данных Привет, энтузиасты данных! Если вы отправились в захватывающее путешествие к тому, чтобы стать аналитиком данных, вы, возможно, жонглируете многими вопросами о том, какие навыки и инструменты должны быть приоритетными. Должен ли я идти ва-банк с Python или должен использовать SQL …

Высвобождение внутреннего статистического детектива: анализ данных и усиление интуиции
Развивайте паучье чутье на подозрительные данные Помните, когда мы были детьми, и мы не могли перестать задавать вопросы? Верьте или нет, но это основной принцип статистического мышления. Многие из нас до сих пор такие. Даже если вы думаете, что это не так, возможно, что-то из этого все еще хранится где-то в вашем подсознании. Каждый раз, когда вы подвергаете сомнению утверждение, основанное на данных, например «Зарабатывайте 500 долларов в день с помощью этого простого метода»..

Как выбросы влияют на статистический вывод?
Вы когда-нибудь сталкивались с выбросами в своих данных — точкой данных, которая значительно отличается от большинства других точек ? Выбросы могут иметь большое влияние на статистический вывод, который представляет собой процесс использования статистических методов для получения выводов о совокупности на основе выборки. В этом посте мы рассмотрим, как выбросы могут повлиять на статистические выводы и что мы…