Публикации по теме 'model-selection'


Методы выбора модели — Часть 3
Итак, мы рассмотрели различные методы оценки модели (Часть 2) и уже рассмотрели основные понятия , необходимые (Часть 1) . Теперь давайте перейдем к последнему разделу истории — Техникам выбора модели . Резюме: необходимость гиперпараметра Как указано в этой статье , гиперпараметры (например, количество эпох, параметр регуляризации и т. д.) — это переменные, которые используются алгоритмом обучения для вычислить лучшие параметры модели. Они должны быть заданы..

Методы выбора модели - экономия и оптимизация
Введение По определению: Экономная модель - это модель, которая достигает желаемого уровня объяснения или предсказания с помощью как можно меньшего числа переменных-предикторов. Степень соответствия статистической модели описывает, насколько хорошо она соответствует набору наблюдений. Меры согласия обычно суммируют несоответствие между наблюдаемыми значениями и значениями, ожидаемыми в рамках рассматриваемой модели. Идея экономных моделей проистекает из бритвы Оккама или «..

Перекрестная проверка
Всякий раз, когда мы сталкиваемся с проблемой машинного обучения или соревнованием Kaggle, мы часто теряемся, думая о том, какой алгоритм / модель машинного обучения мы должны использовать или какой алгоритм / модель даст лучший результат. Нам нужно проверить стабильность нашей модели машинного обучения, чтобы после развертывания она давала желаемый результат. Обычно он повторяется по разным моделям, чтобы найти наиболее эффективную. Однако точность, на основе которой выбрана модель,..

Решение проблемы машинного обучения: регрессия и выбор модели (часть 7)
Введение В предыдущих частях мы обсудили предварительную обработку данных, EDA, выбор функций и очистку. Теперь мы собираемся обсудить выбор модели, прежде чем нам нужно узнать больше информации и показателей. MSE Среднеквадратическая ошибка представляет собой среднее значение квадрата разницы между исходным и прогнозируемым значениями в наборе данных. Он измеряет дисперсию остатков. СКО Среднеквадратическая ошибка — это квадратный корень из средней квадратичной..

Методы перекрестной проверки
Одним из ключевых шагов в построении модели машинного обучения является оценка ее производительности на данных, которые модель не видела раньше. Предположим, что мы подгоняем нашу модель к обучающему набору данных и используем те же данные, чтобы оценить, насколько хорошо она работает. Новые данные.Модель может страдать от недостаточного соответствия (высокая систематическая ошибка), если модель слишком проста, или из-за чрезмерного соответствия обучающим данным (высокая дисперсия), если..