Публикации по теме 'feature-selection'
Выбор функции: применение алгоритмов оптимизации для повышения точности модели
Когда кто-то начинает с машинного обучения, чаще всего он знакомится с мелкомасштабными предварительно обработанными наборами данных, которые обычно имеют небольшое количество связанных с ними атрибутов/функций, но в реальной жизни это не так. Более сложные наборы данных, доступные через Интернет, и настоящие содержат большое количество точек данных и различных связанных с ними атрибутов. Тогда возникает вопрос, зачем собирать такое большое количество атрибутов, а не просто собирать..
Основы машинного обучения: выбор функций (часть 2)
Добро пожаловать назад.
Предыстория того, что именно мы здесь делаем, находится здесь .
Теперь двинемся вперед.
Обратное устранение
Мы будем отбирать компоненты на основе метода обратного исключения .
Что такое обратное исключение ? Это метод сохранения только тех функций, которые важны для набора данных, т. Е. С учетом того, что эти функции вносят существенные изменения в зависимую переменную .
Вот как работает этот алгоритм:
Выберите уровень значимости . Совместите..
Выбор функций в машинном обучении: обзор методов
Методы фильтрации выбирают функции независимо от алгоритма машинного обучения и обычно оценивают саму функцию или с учетом переменной, которую мы хотим предсказать. Методы фильтрации вообще не учитывают взаимодействие с другими признаками, за исключением методов корреляции по тому, какой смысл вы от дубликата. Таким образом, методы фильтрации, о которых мы говорили, очень эффективны в вычислительном отношении. Однако они, как правило, не обеспечивают оптимального подмножества функций..
Выбор функций: как отбросить 95% ваших данных и получить 95% точности
Выбор функции - это фундаментальный шаг в конвейере данных. Пример? В наборе данных MNIST вам нужно всего 40 пикселей (из 784), чтобы получить более 95% точности (99% ROC).
1. Почему выбор функций?
Вы можете распознать эти рукописные цифры?
У вас, вероятно, не было проблем с определением соответственно 0, 3 и 8.
Если это так, вы смогли правильно классифицировать их, даже если было показано только 25% исходного изображения, а остальные 75% были покрыты красными пикселями...
Выбор функции
| Создание конвейера машинного обучения: часть 3
Выбор функций из множества переменных может не только улучшить производительность, но и существенно сократить время обучения, а также значительно упростить интерпретацию модели.
Это третья статья из серии "Создание конвейера машинного обучения", продолжающая упомянутые ниже статьи:
Часть 1: Строительные блоки трубопровода машинного обучения
Часть 2: Считывание данных для разработки функций
1) Введение
Поскольку я..
Применение дарвиновской эволюции к выбору признаков с помощью Kydavra GeneticAlgorithmSelector
Математика почти всегда дает хороший ответ на вопросы, связанные с выбором функций. Однако иногда старые добрые алгоритмы грубой силы могут принести в игру лучший и более практичный ответ.
Генетические алгоритмы — это семейство алгоритмов, вдохновленных биологической эволюцией, которые в основном используют цикл — скрещиваться, мутировать, пробовать, вырабатывая наилучшую комбинацию состояний в зависимости от оценочной метрики. Итак, приступим к коду.
Использование..
Улучшение ваших моделей классификации с помощью необходимых статистических тестов.
Достижение лучших характеристик с помощью исследовательского анализа данных можно улучшить с помощью статистических методов для принятия решений. Эти статистические тесты не только дают лучшие характеристики, но и дают пользователю представление о том, какой прогресс был достигнут для получения хорошего набора данных. Здесь мы собираемся обсудить некоторые из наиболее полезных статистических тестов, применимых к моделям классификации.
Давайте возьмем пример набора данных о раке груди в..