Публикации по теме 'k-fold-cross-validation'


Об оценке модели, выборе и выборе алгоритма
мой реферат «Оценка модели, выбор модели и выбор алгоритма в машинном обучении» С. Рашка Недавно я прочитал отличную статью Себастьяна Рашки Оценка модели, выбор модели и выбор алгоритма в машинном обучении . Определенно, это стоит прочитать, однако может быть трудно понять все быстро. Так что моя аннотация может быть кому-то полезна. Главный вопрос: производительность обобщения (прогностическая эффективность невидимых данных); подбор модели, грубо говоря настройка..

Методы повторной выборки — Серия ISLR: Глава 5
Процесс обучения модели заключается в разделении данных на два набора: обучающий набор и тестовый набор. Когда мы запускаем нашу модель на поезде и тестовом наборе, мы получаем (барабанная дробь!!!!) ошибку поезда и тестовую ошибку соответственно. наша модель работает. Если мы обучим все данные и протестируем их на одних и тех же данных, то, конечно, модель будет работать хорошо, потому что модель видела данные раньше. Ценность модели определяется тем, насколько она точна на невидимых..

Методы борьбы с переоснащением
1. Перекрестная проверка Во время обучения алгоритма часть набора данных используется для проверки производительности модели (это отличается от набора данных для тестирования, который используется после завершения обучения). Этот процесс называется перекрестной проверкой. Очень популярным типом перекрестной проверки является K-кратная перекрестная проверка, при которой в самих обучающих данных выполняется K-кратное тестирование. Здесь можно использовать среднюю точность K итераций..

Что такое стратифицированная перекрестная проверка в машинном обучении?
В этой статье описывается стратифицированная перекрестная проверка и ее реализация на Python с помощью Scikit-Learn. В этой статье предполагается, что читатель уже знаком с перекрестной проверкой в ​​машинном обучении. Что такое стратифицированная выборка? Прежде чем углубляться в стратифицированную перекрестную проверку, важно знать о стратифицированной выборке. Стратифицированная выборка - это метод выборки, при котором выборки отбираются в той же пропорции (путем разделения..

Прогнозирование реакции клиентов на маркетинговую кампанию банка
EDA, визуализация, построение и оценка моделей Введение: Данные связаны с кампаниями прямого маркетинга португальского банковского учреждения. Набор данных можно загрузить из репозитория машинного обучения UCI или с kaggle.com. Маркетинговые кампании были основаны на телефонных звонках. Часто требовалось более одного контакта с одним и тем же клиентом, чтобы узнать, будет ли продукт (срочный банковский депозит) подписан («да») или нет («нет»). Набор данных состоит из 45211 записей и..

K-кратная перекрестная проверка легко объясняется
Перекрестная проверка (CV) — это надежный метод, используемый в машинном обучении для оценки производительности модели. Цель состоит в том, чтобы не быть уверенным, что модель способна хорошо обобщать невидимые данные. Существует несколько методов перекрестной проверки, но я сосредоточусь на методе k-кратного CV. Ниже я пройдусь: Зачем использовать перекрестную проверку? К-кратное резюме Пример Пример на питоне Заключение Зачем это использовать?

Обнаружение мошеннических транзакций
Цель этого проекта — создать модель машинного обучения, которая использует алгоритмы и методы классификации для точной идентификации мошеннических и законных транзакций. В этой статье я буду использовать набор данных Обнаружение мошеннических транзакций от Kaggle для создания модели машинного обучения. Введение данных ID : представляет номер строки транзакции в данных. TRANSACTION_ID : представляет собой уникальный идентификатор для каждой транзакции. TX_DATETIME :..