Публикации по теме 'bias'


TCAV: интерпретируемость за пределами атрибуции функций
Обзор методики интерпретируемости моделей GoogleAI с точки зрения понятных человеку концепций. Недостаточно знать, работает ли модель, нам нужно знать, как она работает: Сундар Пичаи Сегодня акцент постепенно смещается к интерпретируемости модели, а не только к ее предсказаниям. Однако настоящая суть интерпретируемости должна заключаться в том, чтобы сделать модели машинного обучения более понятными для людей, особенно для тех, кто мало разбирается в машинном обучении. Машинное..

Компромисс смещения и дисперсии
Как уменьшить ошибку смещения и дисперсии в вашей модели В процессе построения модели прогнозирующего машинного обучения мы сталкиваемся с ошибками смещения и отклонения. Компромисс смещения и дисперсии - один из самых популярных компромиссов в машинном обучении. Здесь мы рассмотрим, что такое ошибка смещения и ошибка дисперсии, источники этих ошибок и как вы можете работать, чтобы уменьшить эти ошибки в вашей модели. Чем машинное обучение отличается от традиционного..

Остерегайтесь эффекта ореола в проектах по науке о данных
Собираете ли вы только ту информацию, которая поддерживает вашу гипотезу? Что такое «эффект ореола»? Во-первых, давайте разберемся с термином эффект ореола . Термин эффект ореола был впервые введен психологом Эдвардом Торндайком в опубликованной статье Постоянная ошибка в психологических рейтингах . В этой опубликованной статье Торндайк обсуждает, как человек судит о другом человеке, основываясь на своем первоначальном впечатлении/восприятии человека. Например, когда мы..

Влияют ли скрытые предубеждения на ваше будущее?
Одной из старейших четырехбуквенных аббревиатур в компьютерном мире является GIGO (Garbage In Garbage Out). Поколения программистов и аналитиков узнали суровую правду; какой бы хорошо продуманной и сложной ни была система, неверная информация может ее сбить с толку. Данные снова становятся проблемой в системах ИИ из-за вливания предвзятых данных. Существует много литературы о концепции предубеждений, их негативном влиянии на организационные результаты, выявлении типов предубеждений ,..

Предубеждения в данных — Аналитика данных
Предвзятость в анализе данных относится к систематическим ошибкам или отклонениям, которые могут привести к неточным или вводящим в заблуждение выводам. Это может происходить на различных этапах процесса анализа данных, включая сбор данных, предварительную обработку данных, разработку модели и интерпретацию результатов. Вот несколько примеров различных типов предвзятости, которые могут возникнуть при анализе данных: Смещение выборки возникает, когда выборка, используемая для..

Компромисс смещения и дисперсии
В алгоритме контролируемого обучения подход к обучению использует помеченные данные для обучения модели. Алгоритм получает функции входных данных (X) и соответствующие им целевые значения (y) (истинные пары ввода/вывода), а затем обучается на этих данных. алгоритм обучения генерирует функцию (функцию гипотезы), которая может сопоставлять новые невидимые входные признаки с целевым значением (или вероятностью принадлежности к классу) с минимальной ошибкой. Функция гипотезы — это..

Устранение предвзятости вменения
Многие отмечают, что предвзятость в моделях машинного обучения (гендерная, расовая и т. д.) стала большой проблемой и требует дополнительных вложений. Проблема многих систем машинного обучения заключается в том, что они не только отражают предвзятость данных, но и усиливают ее. Один из способов усиления погрешности — это вменение отсутствующих данных. Наиболее распространенный способ обработки отсутствующих данных — их удаление. Второй наиболее распространенный способ — заменить..