Введение

В любых статистических наблюдениях набор измеряемых переменных может быть входными данными. Эти входы имеют некоторое влияние на одну или несколько других переменных, называемых выходами. Цель обучения с учителем - использовать входные данные для прогнозирования значений выходных данных. В статистической литературе по машинному обучению мы имеем

  1. Входные данные часто называют предикторами, также известными как независимые переменные.
  2. Выходы называются откликами, или классически зависимыми переменными.
  3. Функция, которая отображает или объясняет связь между вводом и выводом. в обучении с учителем они известны как функции регрессии. Они соответствуют случаю, когда выходы являются количественными.

В приведенной выше модели нам нужно предсказать количество глюкозы i-го человека, используя инфракрасный спектр поглощения его / ее крови. В основном это предсказание можно сделать двумя разными способами.

  1. Если у нас есть предопределенная модель, мы можем использовать параметрический подход.
  2. Если у нас нет модели, мы используем непараметрический подход.

Параметрическая модель предполагает, что вид функции известен. Когда экспериментатор выбирает одно семейство кривых и вводит варианты выбора в процесс вывода, информация, которую могут предоставить данные относительно разработки модели, затем ограничивается данными в этой предполагаемой параметрической форме. Экспериментатор меньше полагается на данные для получения информации о модели.

Допущение модели без знания точности его или ее предположений может быть опасным в смысле создания вводящих в заблуждение выводов о кривой регрессии.

Если мы выведем приведенное выше уравнение с неизвестной функцией, делая несколько предположений, насколько это возможно, в основном как непараметрическую модель, это может быть как

Почему непараметрическая модель?

  1. Это обеспечивает большую гибкость в возможной форме кривой регрессии и не делает никаких предположений о параметрической форме.
  2. Это только предполагает, что кривая регрессии принадлежит им некоторому бесконечномерному набору функций.
  3. Он в значительной степени полагается на экспериментатора, который предоставляет только качественную информацию о функции, и позволяет данным говорить сами за себя о фактической форме кривой регрессии.
  4. Он лучше всего подходит для вывода в ситуации, когда априорной информации о кривой регрессии очень мало или совсем нет.

Заключение

Параметрическая форма регрессии используется на основе исторических данных; непараметрический можно использовать на любом этапе, поскольку он не требует никаких предположений. Однако параметрическая и непараметрическая регрессия не противоречат друг другу. В то время как последующее вычисление непараметрической формы, основанное на первом результате, может использоваться как параметрическая форма, любой тип параметрической регрессии может использоваться как непараметрический для проверки точности модели, которую мы используем для параметрической регрессии.

Дополнительная литература для непараметрической регрессии.

[1] Ларри Вассерман, Вся непараметрическая статистика, тексты Springer в статистике

[2] Рэндалл Л. Юбэнк, Непараметрическая регрессия и сглаживание сплайнов (1999), MARCEL DEKKER, INC.

Вам также может понравиться эта история.



Если вам понравилось читать эту историю, я хотел бы присылать вам мой еженедельный информационный бюллетень и обновления. Щелкните здесь, чтобы подписаться. Вы также можете связаться со мной через LinkedIn