Публикации по теме 'dimensionality-reduction'


Извлечение признаков с использованием анализа главных компонентов - упрощенная визуальная демонстрация
Понимание преобразования между функциями и основными компонентами Вступление Понимание математики, лежащей в основе анализа главных компонентов (PCA), без прочной основы линейной алгебры является сложной задачей. Когда я преподавал науку о данных на Генеральной Ассамблее в Сан-Франциско, я обнаружил, что помощь студентам в визуализации трансформации между функциями и основными компонентами значительно улучшила их понимание. PCA - это метод уменьшения размерности, который состоит из..

Снижение размерности: анализ главных компонентов
Снижение размерности: Анализ главных компонентов Понимание всего алгоритма PCA по частям. В машинном обучении считается, что чем больше функций, тем лучше наш прогноз, но это не всегда верно. Если мы продолжаем увеличивать количество функций, после определенного момента производительность нашего алгоритма машинного обучения имеет тенденцию к снижению. Согласно феномену Хьюза , если количество обучающих выборок фиксировано, и мы продолжаем увеличивать количество измерений, то..

Как сделать выбор функций / уменьшение размеров?
Важно выбрать лучшие функции для моделей машинного обучения. Удаление нерелевантных функций приводит к: Точность : более эффективная модель Интерпретируемость : проще для понимания. Скорость : модель может работать быстрее. Есть разные способы выбора функций, и это зависит от самих данных и результата, который мы хотим получить. Методы уменьшения размерности: Процент пропущенных значений Отбросьте переменные с высоким процентом пропущенных значений Потому что, если в..

Машинное обучение: что такое «проклятие размерности»?
Слова «Проклятие размерности» кажутся пугающими, как какой-то египетский ужастик, но это одна из самых интересных концепций машинного обучения. Проклятие размерности — это проблемы, связанные с увеличением размерности данных. Возьмем простой пример: если бы я ловил щенка, который может бежать только по прямой, то я мог бы легко поймать его, бегая за ним. Насколько сложно его поймать, если он может бегать в двух измерениях по футбольному полю, а? Теперь представьте, если бы собака..

8 методов уменьшения размерности, которые должен знать каждый специалист по данным
Основное руководство по различным методам уменьшения размерности в Python Исследовательский анализ данных - важный компонент конвейера разработки модели науки о данных. Специалист по данным тратит большую часть времени на очистку данных, разработку функций и выполнение других методов обработки данных. Уменьшение размерности - один из методов, используемых специалистами по обработке данных при проектировании функций. Уменьшение размерности - это процесс преобразования набора данных..