Предвзятость

Смещение — это упрощающие предположения, сделанные моделью для облегчения изучения целевой функции.

линейные алгоритмы имеют высокую предвзятость, что делает их быстрыми для изучения и более легкими для понимания, но в целом менее гибкими. В свою очередь, они имеют более низкую эффективность прогнозирования для сложных проблем, которые не соответствуют упрощающим предположениям.

  • Низкая погрешность. Предлагает меньше предположений о форме целевой функции.
  • Высокая погрешность: предлагает больше предположений о форме целевой функции.

Примеры алгоритмов машинного обучения с низким смещением включают: деревья решений, метод k-ближайших соседей и метод опорных векторов.

Примеры алгоритмов машинного обучения с высокой погрешностью включают: линейную регрессию, линейный дискриминантный анализ и логистическую регрессию.

Дисперсия

Дисперсия описывает, насколько сильно меняется модель при ее обучении с использованием различных частей набора данных.

На алгоритмы машинного обучения с высокой дисперсией сильно влияет специфика обучающих данных. Это означает, что специфика обучения во многом влияет на количество и типы параметров, используемых для характеристики картографической функции.

  • Низкая дисперсия: предлагает небольшие изменения в оценке целевой функции с изменениями в наборе обучающих данных.
  • Высокая дисперсия: предлагает большие изменения в оценке целевой функции с изменениями в наборе обучающих данных.

Примеры алгоритмов машинного обучения с низкой дисперсией включают линейную регрессию, линейный дискриминантный анализ и логистическую регрессию.

Примеры алгоритмов машинного обучения с высокой дисперсией включают: деревья решений, k-ближайших соседей и машины опорных векторов.

Компромисс смещения и дисперсии

  • Увеличение смещения уменьшит дисперсию.
  • Увеличение дисперсии уменьшит смещение.

На самом деле мы не можем рассчитать реальные условия ошибки смещения и дисперсии, потому что мы не знаем фактическую лежащую в основе целевую функцию.

  • Линейные алгоритмы машинного обучения часто имеют большое смещение, но низкую дисперсию.
  • Нелинейные алгоритмы машинного обучения часто имеют низкую погрешность, но высокую дисперсию.

В качестве основы предвзятость и дисперсия предоставляют инструменты для понимания поведения алгоритмов машинного обучения.

Надеюсь, теперь у вас есть четкое представление об этой теме, так как моя цель — извлечь нужную информацию с примерами в максимально запоминающемся формате, не используя длинные абзацы. Приятного обучения!