1. В: В чем разница между линейной регрессией и гребневой регрессией?

О: Они почти идентичны. Линейная регрессия использует метод наименьших квадратов (OLS), чтобы получить беспристрастное решение с высокой дисперсией. Такие вещи, как мультиколлинеарность, могут привести к сбою линейной регрессии. Ридж-регрессия решается почти так же, но с добавлением константы регуляризации. Константа является источником смещения и может уменьшить дисперсию. Чем больше константа, тем больше смещения. Обычно мы рекомендуем использовать гребенчатую регрессию с небольшой константой.

Ридж-регрессия — это адаптация популярного и широко используемого алгоритма линейной регрессии. Он улучшает обычную линейную регрессию, слегка изменяя функцию стоимости, что приводит к уменьшению переобучения моделей. В этой статье вы узнаете все, что вам нужно знать о ридж-регрессии, и как вы можете начать использовать ее в своих собственных проектах машинного обучения.

2. В: В чем разница между использованием линейной регрессии и GLM при выполнении регрессии?

A: GLM настроены на решение более широкого класса проблем и не делают всех тех же предположений, что и линейная регрессия. Без этих предположений они не могут быть решены одинаково. GLM использует численные методы для поиска оценок максимального правдоподобия. Хотя для получения решения используются разные методы, модель все же можно интерпретировать одинаково.

Обычная линейная регрессия применяется, если результат является непрерывной переменной и имеет нормальное распределение. Однако бывают случаи, когда эти два предположения неверны. В таких ситуациях применяется набор обобщенных линейных моделей. GLM имеет три элемента: случайный, систематический и функция связи, которые необходимо указать в каждой реализации модели.

3. В: Если нейронные сети являются универсальным средством обучения и могут использоваться для моделирования чего угодно, то зачем нам нужны другие модели? Почему бы нам просто не сосредоточиться на нейронных сетях и забыть о других моделях?

О: Нейронные сети можно использовать для моделирования чего угодно… Но это не значит, что они — лучший выбор для любой ситуации. Им может потребоваться больше данных, чем доступно. Их обучение и проверка могут занять слишком много времени. Они могут занять слишком много времени, чтобы забить. Вам может понадобиться модель, которую можно интерпретировать.

Каждый тип модели имеет свои сильные и слабые стороны, поэтому при выборе модели не бывает бесплатных обедов.

Дополнительная информация по этому вопросу: