Эта статья написана Алпарсланом Месри и Джемом ОЗЧЕЛИК.

Для лечебного учреждения очень важно, чтобы пациенты, которые обращаются в это учреждение, покидали лечебное учреждение довольными. Удовлетворение пациентов, приходящих в лечебное учреждение, определяется различными параметрами, такими как получаемое ими обслуживание, положительное отношение сотрудников медицинского учреждения, возможности, предлагаемые оборудованием учреждения для посетителей, и тому подобное. В то же время, в дополнение к предоставлению этих возможностей своим посетителям, существуют также меры, которые учреждение здравоохранения может принимать в различных областях, чтобы обслуживать более одного пациента или посетителя и получать наилучшее обслуживание для пациентов, находящихся в больнице. положение клиента. Например, правильное планирование встреч с пациентами, время, необходимое для работы с пациентом, меры предосторожности и подготовка к послеоперационному уходу за пациентами, нуждающимися в операции, повысят удовлетворенность пациентов.

В нашем исследовании мы сосредоточились на проблеме, чтобы предотвратить сбои, возникающие из-за планирования в послеоперационных процессах, чтобы обеспечить удовлетворение пациентов, которым необходимо провести операцию в больнице. И в этом контексте мы рассмотрели вопрос «Сколько дней до операции нужно дать больному, который нуждается в операции». Настолько, что с ответом, который мы сможем найти на эту проблему, в то время как пациенты планируют свою жизнь, руководство учреждения здравоохранения сможет сделать свое собственное планирование, чтобы пациент мог получить наилучшее обслуживание в послеоперационный период. .

В этой статье операции, проведенные в медицинском учреждении, были изучены на выборочном наборе данных, и за сколько дней до операции уместно указать дату операции, чтобы медицинское учреждение могло предоставить этим пациентам наилучшие услуги? Была предпринята попытка найти ответ на вопрос. Вы можете найти набор данных и наш связанный nootbook здесь.

Чтобы прояснить нашу цель в этой задаче, мы можем сказать следующее: в этой задаче мы попытаемся предсказать количество операций, которые будут проведены в больнице в момент времени t, за 3 дня до и за 7 дней до этого, и сравним показатели успешности этих оценок.

Без лишних слов, давайте приступим к нашей работе. Давайте начнем с импорта наших библиотек.

Далее, давайте импортируем наш набор данных.

Давайте посмотрим на описательную статистику набора данных.

Как видно, наш набор данных включает фактическое (количество операций, выполненных на дату операции) и количество операций за 28 дней до момента времени, называемого фактическим. Значения в наборе данных увеличиваются кумулятивно.

Здесь нашим следующим шагом будет рассмотрение значений автокорреляции между днями. Поскольку рассматриваемую нами проблему можно рассматривать как проблему временных рядов, мы будем использовать значение автокорреляции для нахождения связи между событием, происходящим в единицу времени, и событием, происходящим в предыдущую единицу времени. Чтобы дать краткую информацию о значении автокорреляции, автокорреляция между позавчера сегодня и сегодня, как ожидается, сойдется к 1,00, и корреляция будет постепенно уменьшаться по мере того, как мы возвращаемся от сегодняшнего дня.

Давайте теперь ответим на вопрос «Есть ли связь между днями недели и операциями, проводимыми в медицинском учреждении», путем агрегирования дней недели. Здесь мы агрегировали по часовому поясу T-1, который имеет наибольшую автокорреляцию с фактическим значением.

Первые 5 строк на этом изображении показывают средние значения, а следующие 5 строк показывают стандартные отклонения.

Теперь, когда мы увидели статистические значения нашего набора данных, давайте получим более описательную информацию о нашем наборе данных и проблеме, с которой мы имеем дело, выполнив визуализацию данных.

Как видно, больше всего операций по дням недели приходится на четверг. Меньше всего операций приходится на пятницу. Давайте также рассмотрим средние различия в количестве операций, выполненных с использованием boxplot.

Мы видим, что, глядя на количество операций, выполненных по дням недели, мы можем сделать вывод о наличии разницы между средними показателями. Поскольку пятница и понедельник являются конечными и начальными днями недели, мы можем интерпретировать, что уровень шума более заметен в эти два дня. Однако нам необходимо статистически доказать эту интерпретацию, сделанную на глаз.

После визуализации переменных набора данных давайте проведем тест на аномалии для числовых переменных в наборе данных. Для этого мы будем использовать тест One-Way ANOVA.

Поскольку мы рассмотрели средние значения и значения стандартного отклонения переменных с именами T-x* в наборе данных в таблице, мы можем выполнить наш тест ANOVA. Прежде чем мы запустим наш тест ANOVA, давайте установим наши гипотезы, которые мы назовем H0 и H1:

H0: Общее количество операций не зависит от дня недели.
H1 (Альтернативная гипотеза): Общее количество операций зависит от дня недели.

Таблица результатов выполненного нами теста ANOVA выглядит следующим образом. В нижней части таблицы вы можете увидеть результаты теста ANOVA:

  • Глядя на результат теста ANOVA, мы отвергаем гипотезу H0 с доверительным интервалом 99%. В результате теста мы видим, что значение P, которое мы видим, составляет ‹0,05.
  • Глядя на результат теста, мы можем четко сказать: существует статистическая разница между днями недели.

После этого этапа проверяем с помощью теста ТЬЮКИ, есть ли существенная разница между количеством операций, выполняемых в один день недели и в другой день недели в сочетании с ним.

Результаты теста TUKEY показывают нам, что существует разница между количеством операций, выполненных в любой день недели, и количеством операций, выполненных в другую неделю.

Теперь мы создадим модель линейной регрессии, чтобы найти ответ на вопрос: «За сколько дней до операции мы можем назначить наиболее подходящую операцию пациенту, который поступает в больницу для операции?»

Во-первых, давайте уточним параметры нашей модели, которую мы будем строить на нашем наборе данных:

  • Зависимой переменной, которая будет использоваться в модели линейной регрессии, является «Фактическая» переменная. Наши независимые переменные — это все столбцы с T-1 по T-28.

Момент, на который мы обратили внимание при настройке этой модели, заключается в том, что нам нужно очистить ненужные части набора данных из набора данных. (Мы видели выбросы на диаграмме).

Затем приступим к созданию нашей модели.

Во-первых, давайте оценим объем операции, которая будет проведена на следующий день, по значениям за последние три дня.

Глядя на таблицу OLS, мы можем вывести уравнение для нашей модели регрессии:

ФАКТ = (T-1)*1,0908 + (T-2)*0,1453 + (T-3)*(-0,1908) + 0*

*ПРИМЕЧАНИЕ. Поскольку модель не содержит констант, мы получили нулевую стандартную ошибку.

Подгоняем нашу модель:

Давайте также найдем наши показатели производительности RMS, RMSE и другие показатели модели регрессии для подходящей модели.

Мы проанализировали данные за последние три дня и количество операций, которые состоятся на следующий день. Теперь давайте попробуем сделать прогноз на основе данных за последние 28 дней, исключая последние 3 дня. Другими словами, оценим количество операций, которые будут проведены на 3 дня вперед:

Мы построили нашу модель, которая прогнозирует количество операций, выполненных за 3 дня до даты операции, и получили показатели производительности. Результаты выглядят не плохо. Тем не менее, руководство больницы хочет иметь возможность оценить более чем за 3 дня. Более ранняя оценка позволит руководству больницы назначить пациентам более раннюю дату операции. Ожидается, что прогноз, сделанный за последние 3 дня, будет более успешным, чем прогноз, сделанный за последние 7 дней. Однако, если нет существенной разницы в этих успехах оценки, руководство больницы желает сделать более раннюю оценку в обмен на отказ от некоторого успеха в мощности оценки. Итак, давайте настроим модель прогнозирования 7 дней назад.

Мы настроили нашу модель за 7 дней до даты операции и получили результаты, связанные с производительностью нашей модели. Теперь давайте сравним созданные нами модели, чтобы принять четкое решение о наиболее подходящей дате назначения операции.

Рассматривая эту таблицу, мы можем сказать:

  • Учреждение здравоохранения, рассмотренное в наборе данных, может точно определить ожидания операции за 3 дня до дня операции с наименьшей ошибкой оценки.
  • Наш технический вывод состоит в том, что последние 3 дня имеют наибольшую корреляцию с днем ​​операции. Назначить операцию можно, ознакомившись с ситуацией за 3 дня до операции.
  • Нет никакой разницы, которую руководство больницы может считать жизненно важной, между успешным прогнозом, сделанным за последние 3 дня, и успешным прогнозом, сделанным за последние 7 дней. Тогда руководство больницы может делать прогнозы на 7 дней вперед.

Мы получили наш результат, и, наконец, мы смотрим, как построенная нами модель следует шаблону на графике временного ряда.

Мы подошли к концу нашей работы. Я надеюсь, что это был приятный сеанс чтения для вас. До встречи в нашей следующей статье.

Использованная литература:

1: https://github.com/simplextable/Surgery_Volume

2: https://github.com/rashidesai24