От проблемы к подходу…!!!

Я описал базовую методологию Data Science со всеми важными вопросами, например, какой вопрос вы должны задать на каком этапе, если вы не читали эту статью и уже читали здесь, я объяснил другой модульный процесс того же курса.

Это случилось с вами? Ваш начальник пригласил вас на встречу, на которой вы были проинформированы о важной задаче, которую вы должны абсолютно выполнить в течение очень короткого периода времени. Они оба приходят и уходят, чтобы удостовериться, что все аспекты задачи были приняты во внимание, и что встреча заканчивается заверениями обоих в том, что все идет в правильном направлении. Ближе к вечеру, потратив некоторое время на изучение различных вопросов, он понимает, что ему нужно задать еще несколько вопросов, чтобы действительно выполнить свою задачу.

К сожалению, босс недоступен до завтрашнего утра. Теперь, со сжатыми сроками в ушах, он начинает испытывать чувство волнения. Так чем ты занимаешься? Вы рискуете или останавливаетесь, чтобы попросить разъяснений?

План статьи:

#1) Бизнес-понимание

Методология науки о данных начинается с поиска разъяснений, чтобы достичь того, что можно назвать пониманием бизнеса. Это понимание находится в начале методологии, потому что вы можете определить, какие данные отвечать на центральный вопрос, уточнив проблему, которую необходимо решить.

  • Слишком часто много усилий тратится на то, чтобы ответить на волнующий людей вопрос. Хотя методы решения этого вопроса могут быть полезны, они не решают проблему. Постановка четко сформулированного вопроса начинается с понимания цели человека, задающего вопрос.
  • Например, если владелец бизнеса спрашивает: "Как мы можем снизить стоимость деятельности?" Нам нужно понять, является ли цель повышением эффективности деятельности. Или следует повысить рентабельность компаний? Как только цель ясна, следующая часть головоломки определяет цели, которые ее поддерживают. Разбивка целей может привести к структурированным обсуждениям, которые устанавливают приоритеты, которые могут помочь организовать и спланировать, как справиться с проблемой.

В зависимости от проблемы в обсуждении должны участвовать разные заинтересованные стороны, чтобы определить требования и прояснить проблемы.

Пример использования:

Давайте рассмотрим пример применения бизнес-понимания. В кейсе задаются следующие вопросы:

  • Как оптимально распределить ограниченный бюджет на здравоохранение для обеспечения качественного лечения? … Этот вопрос стал горячей темой для американского страховщика.

Поскольку государственные средства на реадмиссию сократились, страховая компания рисковала компенсировать разницу в расходах, что могло привести к увеличению расходов для ее клиентов.

  • Зная, что более высокие страховые ставки не будут популярны, страховая компания связалась с местными органами здравоохранения и наняла эксперта по науке о данных, чтобы узнать, как можно применить науку о данных. вопрос. Прежде чем мы смогли начать сбор данных, нам нужно было определить цели. Потратив время на постановку целей, команда определила приоритетную повторную госпитализацию как эффективную область для проверки.

  • С учетом поставленных задач установлено, что около 30% прошедших реабилитационное лечение будут реинтегрированы в реабилитационный центр в течение одного года. и что 50% будут возобновлены в течение пяти лет. После просмотра некоторых записей было обнаружено, что пациенты с сердечной недостаточностью занимают первые места в списке повторных госпитализаций.
  • Также было обнаружено, что для изучения этого сценария и определения причины этого явления можно применить модель дерева решений. Чтобы получить представление о бизнесе, которое поможет аналитической группе сформулировать и реализовать свой первый проект, специалисты по данным предложили и организовали семинар на месте.
  • Участие ключевых коммерческих спонсоров на протяжении всего проекта было важным в качестве спонсора: определение общего направления. Он оставался преданным и советовал. В случае необходимости он получал необходимую поддержку. Наконец, для каждой построенной модели были определены четыре бизнес-требования.

А именно: прогнозировать результаты повторной госпитализации пациентов с сердечной недостаточностью, прогнозировать риск повторной госпитализации. Поймите комбинацию событий, которая привела к ожидаемому результату. Примените процесс, понятный новым пациентам из-за риска повторной госпитализации.

#2) Аналитический подход

  • Выбор правильного аналитического подхода зависит от заданного вопроса. Подход заключается в том, чтобы попросить человека, задающего вопрос, уточнить наиболее подходящую форму или подход. здесь мы можем понять второй этап методологии науки о данных. После определения проблемы, которую необходимо решить, выбирается соответствующий аналитический подход в контексте потребностей предприятия. Это второй шаг в методологии науки о данных.

  • Как только будет достигнуто глубокое понимание вопроса, можно будет выбрать аналитический подход. Это означает определение того, какой тип шаблона необходим для более эффективного решения проблемы.
  • Когда дело доходит до определения вероятностей действия, можно использовать прогностическую модель.
  • Когда дело доходит до выявления взаимосвязей, может потребоваться описательный подход. Это будет тот, который анализирует похожие группы действий на основе событий и предпочтений.

  • Статистический анализ относится к проблемам, требующим учетных записей. Например, если вопрос требует ответа «да/нет», уместным будет классификационный подход к прогнозированию ответа. Машинное обучение — это область исследования, в которой компьютеры могут учиться без явного программирования. Машинное обучение можно использовать для выявления взаимосвязей и тенденций в данных, которые в противном случае были бы недоступны или идентифицированы.

Пример использования:

  • В случае, когда задается вопрос о человеческом поведении, уместным ответом будет использование подходов кластеризации. Давайте теперь рассмотрим пример применения аналитического подхода. Для тематического исследования использовалась модель классификации дерева решений для определения комбинации условий, которые привели к результатам для каждого пациента.

  • В этом подходе проверка переменных в каждом из узлов на каждом пути листа приводит к соответствующему порогу. Это означает, что классификатор дерева решений возвращает как ожидаемый результат, так и вероятность этого результата в зависимости от доли доминирующего результата (да или нет) в каждой группе. На основе этой информации аналитики могут определить риск повторной госпитализации или вероятность положительного ответа для каждого пациента.
  • Если преобладающий результат — да, риск — это просто доля пациентов, ответивших утвердительно. В противном случае риск равен 1 минус доля пациентов на листе. Модель классификации дерева решений легко понять и применить к ученым, не занимающимся данными, для оценки риска повторной госпитализации новых пациентов. .
  • Врачи могут легко определить, при каких состояниях пациент считается подверженным риску, а во время госпитализации можно разработать несколько моделей и использовать их в разное время.
  • Это дает движущуюся картину риска пациента и его эволюции при различных используемых методах лечения. По этим причинам для создания модели повторной госпитализации по сердечной недостаточности был выбран подход к классификации дерева решений.

Спасибо за прочтение…!!! Следующая статья будет через несколько дней…!!!

Использованная литература :

  1. https://www.coursera.org/learn/data-science-methodology