Скажем, у вас есть входы X (вероятно, вектор) и выход Y (возможно, одномерные). Ваша цель - предсказать Y с учетом X.
Генеративный метод использует модель совместной вероятности p (X, Y) для определения P (Y | X). Таким образом, возможно, учитывая генеративную модель с известными параметрами, для совместной выборки из распределения p (X, Y) для создания новых выборок как входного X, так и выходного Y (обратите внимание, что они распределяются в соответствии с предполагаемым, а не истинным распределением, если вы сделай это). Сравните это с дискриминационными подходами, которые имеют только модель формы p (Y | X). Таким образом, получив вход X, они могут выбрать Y; однако они не могут пробовать новый сертификат X.
Оба предполагают модель. Однако дискриминационные подходы предполагают только модель того, как Y зависит от X, а не от X. Генеративные подходы моделируют и то, и другое. Таким образом, учитывая фиксированное количество параметров, вы можете возразить (и у многих есть), что их проще использовать для моделирования того, что вам небезразлично, p (Y | X), чем распределение X, поскольку вам всегда будет предоставлен X, для которого вы хотите знать Y.
Полезные ссылки: эта (очень короткая) статья Тома Минки. Эта основополагающая статья Эндрю Нг и Майкла Джордана.
Различие между параметрическими и непараметрическими моделями, вероятно, будет труднее понять, пока у вас не будет большего опыта работы со статистикой. Параметрическая модель имеет фиксированное и конечное количество параметров независимо от того, сколько точек данных наблюдается. Большинство вероятностных распределений являются параметрическими: рассмотрим переменную z, которая представляет собой рост людей, предположительно распределенных нормально. По мере того, как вы наблюдаете за большим количеством людей, ваша оценка параметров \ mu и \ sigma, среднего и стандартного отклонения z, становится более точной, но у вас по-прежнему есть только два параметра.
Напротив, количество параметров в непараметрической модели может расти с увеличением объема данных. Рассмотрим индуцированное распределение по росту людей, которое устанавливает нормальное распределение для каждой наблюдаемой выборки со средним значением, полученным в результате измерения, и фиксированным стандартным отклонением. Тогда предельное распределение по новым высотам представляет собой смесь нормальных распределений, и количество компонентов смеси увеличивается с каждой новой точкой данных. Это непараметрическая модель роста людей. Этот конкретный пример называется оценкой плотности ядра. Популярные (но более сложные) непараметрические модели включают гауссовские процессы для регрессии и процессы Дирихле.
Хорошее руководство по непараметрическим параметрам можно найти здесь, которое строит китайский ресторанный процесс как предел модели конечной смеси.
person
Ben Allison
schedule
23.05.2014