Максимизация ожиданий Переоценка

Как правило, итерационная процедура переоценки останавливается, когда lambda.bar - lambda меньше некоторого значения эпсилон.

Как именно определить это значение эпсилон? Я часто вижу только то, что в документах написано как общий символ эпсилон, и никогда не используется фактическое значение, которое, как я предполагаю, будет меняться в зависимости от данных.

Так, например, если значение лямбда моей первой итерации было 5*10^-22, второй итерации было 1,3*10^-15, третьего было 8,45*10^-15, четвертого было 1,65*10^-14 и т. д. ., как бы я определил, когда алгоритму больше не нужны итерации?

Более того, что если бы я применил тот же алгоритм к другому набору данных? мне нужно изменить мои определения эпсилон?

Извините за длинный вопрос. Довольно озадачен этим... :)


person Community    schedule 10.05.2013    source источник


Ответы (2)


«Как бы я определил, что алгоритму больше не нужны итерации?»

Когда вы получаете «достаточно хороший» результат в разумные сроки. ;-)

«Более того, что, если бы я применил тот же алгоритм к другому набору данных? Мне нужно было бы изменить свои определения эпсилон?»

Да, скорее всего.

person Alptigin Jalayr    schedule 10.05.2013
comment
Если ваш второй ответ — единственный вариант, тогда было бы сложно реализовать EM вычислительно и автоматически, верно? Поэтому я бы предположил, что есть лучшее решение, чем необходимость адаптировать его для каждого входа. Что, если бы кто-то работал с 1000 различных наборов информации (скажем, последовательностями белков) и хотел бы найти MLE для общей популяции белков. Они взяли бы log(лямбда)1+...+log(лямбда)N для числа (N) белков, чтобы определить окончательную лямбда, представляющую всю популяцию для каждой итерации. Итак, как определить лямбда для каждого белка автоматически? - person ; 10.05.2013

Если вы можете себе это позволить, вы можете просто позволить ему повторяться до тех пор, пока обновленное значение ‹= старому значению (это может быть ‹ из-за ошибки с плавающей запятой). Я был бы склонен идти с этим, пока у меня не кончилось терпение или бюджет процессора.

person mcdowella    schedule 10.05.2013