Публикации по теме 'feature-scaling'


Стандартизация или нормализация ?
Стандартизация или нормализация? Всякий раз, когда кто-то входит в прекрасный мир науки о данных, он сталкивается с множеством новых терминов, которые могут быть очень пугающими для новичков, как и все остальные. Я также сталкивался с этой проблемой (не волнуйтесь, со временем становится легче ), и поэтому я решил помочь своим однокурсникам облегчить этот переход. Когда дело доходит до науки о данных, существуют различные шаги, алгоритмы, параметры и т. д. Сегодня мы сосредоточимся на..

Нужно ли нам масштабирование функций для категориальных функций?
Что такое масштабирование? Масштабирование — важный шаг в разработке функций при построении модели машинного обучения. Масштабирование приводит независимые функции в один масштаб, чтобы их можно было сравнивать и обучать более эффективно. Это также помогает избежать смещения в сторону функций, которые имеют более широкий диапазон значений. Зачем нам нужно масштабирование? Возьмем пример, есть 2 независимых признака — Возраст человека и годовой доход. Возраст может..

Урок 19 — Машинное обучение: интуиция масштабирования и нормализации функций
В этом уроке мы обсудим масштабирование и нормализацию функций, методы, используемые для стандартизации диапазона независимых переменных или функций в вашем наборе данных. Мы сосредоточимся на построении интуиции вокруг этих концепций и на том, почему они важны для машинного обучения. Масштабирование и нормализация признаков — это этапы предварительной обработки, которые помогают повысить производительность и сходимость алгоритмов машинного обучения. Многие алгоритмы, такие как..

Концепция машинного обучения -5: Метод уменьшения размерности t-SNE.
Метод уменьшения размерности: t-SNE =› t-SNE (t-Distributed Stochastic Neighbor Embedded) — это метод уменьшения размерности, который часто используется в машинном обучении для визуализации многомерных данных. =› t-SNE особенно полезен для изучения и интерпретации наборов данных, которые имеют много переменных или измерений, таких как изображения, речевые данные и текстовые данные. => Технически t-SNE работает, сначала вычисляя попарные расстояния между всеми точками данных в..

Масштабирование функций в машинном обучении
Масштабирование функций в машинном обучении Допустим, вы столкнулись с набором данных о ценах на жилье в вашем районе с соответствующей площадью в квадратных футах. Вы, как энтузиаст данных, хотите понять взаимосвязь между площадью и ценой. Первое, что вы, вероятно, сделаете, это создадите точечный график. Вот как это выглядит. Вдохновленный тем, что вы видите, вы теперь хотите подобрать линию регрессии к этим данным. Вот как это выглядит. Хотя на первый взгляд это..

Резюме: Урок 1 — Урок 5
Урок 1. Введение в машинное обучение Машинное обучение — это подмножество искусственного интеллекта, которое включает в себя обучение модели изучению закономерностей на основе данных и выработке прогнозов или решений. Контролируемое обучение: модель учится на размеченных данных (пары ввода-вывода) и делает прогнозы для новых входных данных. Неконтролируемое обучение: модель учится на немаркированных данных и выявляет закономерности, такие как кластеризация или уменьшение..

Масштабирование функций с помощью Sci-kit Learn
Масштабирование функций является частью предварительной обработки данных, которая является наиболее важным этапом в жизненном цикле науки о данных. Это процесс нормализации диапазона значений независимых переменных или признаков. Масштабирование функций включает в себя различные методы, такие как стандартизация, нормализация, надежное масштабирование и максимальное абсолютное масштабирование. Мы постараемся понять эти методы и их реализацию в python, используя библиотеку..