Регрессия Softmax (полиномиальная логистика) с PyMC3

Я пытаюсь реализовать логистическую полиномиальную регрессию (регрессия AKA softmax). В этом примере я пытаюсь классифицировать набор данных радужной оболочки.

У меня проблема с указанием модели, я получаю ошибку оптимизации с find_MAP(). Если я избегаю использования find_MAP(), я получаю «выборку» всех нулевых векторов, если я использую Categorical для вероятности, или апостериор, точно такой же, как и априорные, если я использую Mutinomial(n=1, p=p).

import pymc3 as pm
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

iris = sns.load_dataset("iris")
y_2 = pd.Categorical(iris['species']).labels
x_n = iris.columns[:-1]
x_2 = iris[x_n].values
x_2 = (x_2 - x_2.mean(axis=0))/x_2.std(axis=0)
indice = list(set(y_2))

with pm.Model() as modelo_s:

    alfa = pm.Normal('alfa', mu=0, sd=100, shape=3)
    beta = pm.Normal('beta', mu=0, sd=100, shape=(4,3))

    mu = (alfa[indice] + pm.dot(x_2, beta[:,indice])).T
    p = pm.exp(mu)/pm.sum(pm.exp(mu), axis=0)

    yl = pm.Categorical('yl', p=p, observed=y_2)
    #yl = pm.Multinomial('yl', n=1, p=p, observed=y_2)

    start = pm.find_MAP()
    step = pm.Metropolis()
    trace_s = pm.sample(1000, step, start)

person aloctavodia    schedule 12.02.2016    source источник


Ответы (1)


Проблема, вероятно, заключается в отсутствии гиббовского обновления переменных с векторным значением. Таким образом, переход допускается только в том случае, если все двоичные значения дают хороший logp. Этот PR может быть полезен: # 799

Итак, вы можете попробовать: pip install git+https://github.com/pymc-devs/pymc3@gibbs, а затем выполните команду Metropolis(gibbs='random').

person twiecki    schedule 15.02.2016