Публикации по теме 'k-fold'


Что такое стратифицированная перекрестная проверка в машинном обучении?
В этой статье описывается стратифицированная перекрестная проверка и ее реализация на Python с помощью Scikit-Learn. В этой статье предполагается, что читатель уже знаком с перекрестной проверкой в ​​машинном обучении. Что такое стратифицированная выборка? Прежде чем углубляться в стратифицированную перекрестную проверку, важно знать о стратифицированной выборке. Стратифицированная выборка - это метод выборки, при котором выборки отбираются в той же пропорции (путем разделения..

ИИ для обнаружения рака
РАК - этот термин почти всегда вызывает у кого-нибудь страх. По оценкам, в Сингапуре у 1 из каждых 4-5 человек может развиться рак в течение жизни, причем рак груди занимает первое место среди женщин ( источник ). Хотя приятно знать, что с развитием здравоохранения рак больше не является смертным приговором для каждого пациента, но стоимость лечения непомерно высока. Фактически, стоимость лечения рака на поздней стадии колеблется от 8 до 17 тысяч долларов в месяц ( источник ) ...

пропуск против KFold
В машинном обучении «разделитель» относится к инструменту или методу, который используется для разделения набора данных на отдельные подмножества для обучения и тестирования модели машинного обучения. Разделение набора данных является обычной практикой в ​​​​машинном обучении, чтобы избежать чрезмерной подгонки модели к обучающим данным и оценить эффективность обобщения модели на невидимых данных. Как правило, производится случайное разделение с фиксированным соотношением (например, 80 %..

Оценивать модели машинного обучения
Машинное обучение В области машинного обучения оценка моделей играет решающую роль в обеспечении их точности и эффективности при прогнозировании новых данных. Хорошо обученная модель — это не только достижение высокой точности, но и способность обобщать невидимые данные. Конечной целью является разработка модели, которая может распознавать закономерности и делать точные прогнозы на основе новых данных с высокой степенью достоверности. В этой статье мы рассмотрим различные..

Машинное обучение для обнаружения мошенничества с использованием классификатора XGBoost
Введение Представьте себе, что вы стоите у кассы в супермаркете, позади вас длинная очередь, а кассир не очень тихо объявляет, что ваша карта отклонена. В данный момент вы, вероятно, не думаете о науке о данных, которая определила вашу судьбу. Хотя вы уверены, что у вас есть средства, чтобы покрыть все, карта все равно не примет платеж. После этого вы отходите в сторону и позволяете кассиру обслуживать другого покупателя, а вам приходит уведомление или сообщение от банка, что..

Перекрестная проверка в науке о данных!
"Перекрестная проверка — это статистический метод оценки и сравнения алгоритмов обучения путем разделения данных на две части: одна использовалась для изучения или обучения нашей модели, а другая — для проверки нашей модели". Вы поняли приведенные выше строки? Посмотрим простыми словами, При использовании некоторого набора данных мы создаем модель машинного обучения, мы часто разбиваем наш набор данных на наборы для обучения и тестирования. Набор обучающих данных обычно используется..

Быстрый старт K-кратной перекрестной проверки с практическим примером использования машинного обучения в Python
Быстрый старт K-кратной перекрестной проверки с практическим примером использования машинного обучения в Python Оглавление: Введение в машинное обучение О машинном обучении Что такое машинное обучение и его применение 2. Перекрестная проверка Перекрестная проверка и ее виды K-кратная перекрестная проверка 3. Практический пример: прогнозирование статуса кредита с помощью метода K-кратной перекрестной проверки 4. Заключительное резюме 1.1 О машинном..