Я писал о генеративном моделировании и в настоящее время изучаю байесовские методы моделирования реальных проблем. В этой статье рассказывается о прогнозировании продолжительности последовательного менструального цикла у женщин с использованием модели байесовской иерархии, поскольку она играет очень важную роль в управлении бесплодием и естественном планировании семьи.

По сути, в менструальном цикле 4 фазы, и прогнозирование продолжительности этих фаз имеет большое значение для вышеупомянутых аспектов. 4 фазы менструального цикла: менструальная фаза (1–5 дней), фолликулярная фаза (1–13 день), фаза овуляции (день 14) и 4) лютеиновая фаза.

Чтобы получить подробное представление о фазах, прочтите статью: https://www.menstrupedia.com/articles/physiology/cycle-phases

Период фертильности женщины основан на традиционных календарных расчетах и ​​иногда с использованием других симптомов самоконтроля, таких как базальная температура тела или наблюдение цервикальной слизи. Считается, что нарушение менструального цикла связано со снижением фертильности и повышенным риском развития различных хронических заболеваний, таких как рак груди, сердечно-сосудистые заболевания и диабет.

Цель этой байесовской иерархической модели - сделать возможным прогнозирование каждой из этих двух характеристик менструального цикла для женщины. На очень высоком уровне байесовская модель пытается узнать значения характеристик от каждого из испытуемых в качестве предварительного распределения для следующего предмета. Таким образом, наблюдения одного субъекта могут быть использованы другим субъектом. Прогнозирующее распределение длины предовулярной фазы можно использовать для прогнозирования вероятности зачатия в следующем цикле как функции полового (до полового акта) поведения, и эта возможность приводит к интересным приложениям для определения наиболее фертильного окна девушка.

НАБОР ДАННЫХ: 1798 субъектов в возрасте от 18 до 50 лет. Каждая женщина выполнила не менее 6 последовательных циклов, что в итоге дало 36641 цикл. Самая длинная зарегистрированная последовательность последовательных циклов включает 109 измерений. Для каждой женщины регистрировалась продолжительность каждого менструального цикла, а также дневная базальная температура тела и дни, в течение которых происходили менструальные кровотечения.

В наборе данных наблюдались несколько характеристик относительно отдельных последовательностей длины цикла и длины преовуляторной фазы:

(i) Поскольку данные записываются в днях, наблюдаемые длины являются дискретными. (ii) Медленный нисходящий временной тренд обычно наблюдается для последовательностей, охватывающих многие годы. Хорошо известно, что средняя длина имеет тенденцию к уменьшению в течение длительного периода времени. зависимость от возраста женщины. Продолжительность цикла отображается в зависимости от времени для женщины с самой длинной записанной последовательностью последовательных циклов в базе данных.

МОДЕЛЬ

Рассмотрим отдельную женщину, и пусть yt обозначает продолжительность ее t -го менструального цикла (⁠t = 1,2,… ⁠) в днях или, альтернативно, фазы гипотермии в базальной температуре тела. . Наша основная цель - получить прогнозное распределение на один шаг вперед.

для t = 1,2,… Мы заинтересованы в оценке Ft + 1 (x) в целом, поскольку существенная изменчивость в пределах отдельных рядов означает, что интервальные прогнозы более подходят, чем точечные прогнозы.

При поиске статистической модели, подходящей для описания наблюдаемых процессов, мы должны учитывать, что существует вариативность как внутри, так и между женщинами. Подход, используемый для моделирования этих двух источников вариаций, можно описать следующим образом. Чтобы объяснить изменения от цикла к циклу для конкретной женщины, здесь предлагается параметрическая модель, Gt + 1 полностью определена, а θ - это вектор неизвестных параметров. Затем мы предполагаем, что функциональная форма Gt + 1 одинакова для всех женщин, в то время как остаточную изменчивость между женщинами можно описать, допустив, что θ варьируется для разных субъектов в соответствии с распределением вероятностей p (θ | ζ). Наконец, мы формулируем проблему в байесовской структуре, задав априорное распределение для ζ.

Формулировка иерархической модели следует непосредственно из индивидуальной модели, позволяя θ варьироваться у женщин в соответствии с распределением вероятностей p (θ | ζ).

РЕЗУЛЬТАТ И ДИАГНОСТИКА:

Большой размер базы данных позволяет случайным образом разделить женщин на 2 группы. Первая группа из 1100 женщин используется для оценки, а вторая группа из 698 женщин используется для диагностики. Таким образом, результаты, полученные во второй группе, дают представление об истинных характеристиках модели. производительность подобранных моделей с точки зрения среднеквадратичной ошибки (MSE) прогнозов на один шаг вперед, оцененных на тестовой группе. Поскольку апостериорные распределения для отдельных конкретных параметров недоступны для женщин в тестовой группе, для получения прогнозного распределения, необходимого при вычислении MSE, они были заменены относительными величинами населения.

Теперь в этом разделе рассказывается о том, как использовать эту модель. На рисунке показаны наблюдаемые длины цикла для конкретной женщины вместе с 95% прогнозными интервалами, полученными из Ft + 1 (x). Следует иметь в виду, что на практике выходные данные отображаются постепенно, эволюционируя слева направо по мере того, как становятся доступными последовательные наблюдения, и что интервал прогноза для длины (t + 1) -го цикла вычисляется в конце ый цикл.

Первая панель рисунка 5 показывает наблюдаемую продолжительность преовулярной фазы для другой женщины, а нижняя панель показывает прогнозируемые плотности длины преовулярной фазы для ее 6-го и 31-го цикла. Две плотности довольно разные. В частности, 31-й цикл плотности смещен влево и менее рассредоточен. Сдвиг местоположения показывает, как модель учится на данных на локальном уровне ряда, который на рисунке 5 (верхняя панель), кажется, уменьшается. Уменьшение дисперсии связано с дополнительными данными, которые доступны ко времени 31-го цикла.

Прогнозирующее распределение продолжительности преовулярной фазы можно использовать непосредственно при естественном планировании семьи и лечении бесплодия. Однако для этого типа приложений нам также нужна вероятность зачатия в цикле с учетом определенного полового поведения. Пусть R будет вектором, описывающим конкретный образец совокупления во время цикла, то есть R = [r1, r2,. . . ], где ri = 1, если половой акт происходит в i-й день, и ri = 0 в противном случае, а U (y, R) - вероятность зачатия в цикле с учетом дня овуляции, y и полового акта R.

Функцию U (y, R) нельзя использовать проспективно, поскольку мы не знаем день овуляции в следующем цикле. Однако, если мы объединим U (y, R) с прогнозным распределением y, мы сможем вычислить вероятность зачатия в следующем цикле, Vt + 1 (R), с учетом полового поведения R и ранее наблюдаемой длины предовулярной поэтапно

Итак, круто то, что если мы хотим определить x наиболее плодородных дней в следующем цикле, мы можем просто найти R, которое максимизирует Vt + 1 (R) при ограничении r1 + r2 + ∙ ∙ ∙ = x. Определение наиболее фертильных дней часто используется парами, которые пытаются достичь или избежать зачатия с помощью методов повышения осведомленности о фертильности.

Еще один пример использования Vt + 1 (R) для той же женщины, риск зачатия, когда половой акт происходит только в первые i (i = 1, ..., 12) дней цикла с одним из следующие 2 режима: ежедневный половой акт и половой акт только в нечетные дни. Предположение о ежедневном половом акте обеспечивает верхнюю границу вероятности зачатия в цикле и может использоваться для оценки продолжительности бесплодного предовулярного периода.

На графиках: наиболее плодородные интервалы для 6 и 31 циклов женщины. Высота столбцов дает прогнозируемую вероятность зачатия при ежедневных половых актах в интервале, указанном в нижней части столбцов.

На графиках выше: прогноз вероятности зачатия для циклов 6 и 31 для женщины при предположении, что у нее были половые контакты каждый день и в нечетные дни в первые i (i = 1, ..., 12) дней цикла.

Таким образом, мы видим, как статистическую модель, основанную на байесе, можно использовать для прогнозирования продолжительности последовательных циклов и помочь нам предсказать наиболее плодородный период для зачатия или непопадания. Эти прогнозы менструального цикла также можно использовать для диагностики проблем у женщин.

Определенно, байесовский метод воспринимает женщин лучше, чем мужчин или сам женщин !!

Ссылка на статью: бумага.