Простое описание «принятия решения», вероятно, представило бы процесс как простую функцию, имеющую ввод и генерирующую вывод. Этот функциональный подход - это не только способ организации ваших вычислений или наиболее фундаментальный компонент исчисления, но, помимо этого, он также является фундаментальным компонентом того, как работает механизм «принятия решений». Этот феномен влияет на нашу жизнь по-разному, например, еда, которую вы хотите съесть на ужин, пункт назначения для следующего отпуска, выбор дисциплины в колледже, люди, с которыми вы хотите провести свою жизнь, и множество других примеров. Излишне говорить о количестве научных исследований по этой теме, охватывающих различные области, такие как психология, нейробиология и философия. Так что я не пытаюсь изучать хорошо известную научную литературу, а скорее хочу построить эту статью на совершенно новой концепции, которая тесно связана с процессом принятия решений: управление данными и надежность моделей и данных ...

Концепция принятия решений на основе данных потрясла мир бизнес-аналитики, о чем свидетельствуют различные источники, подобные этому первому, где идея описывается как сочетание очень сложных технологий, таких как базы данных, автоматизация, расширенная визуальная аналитика, информационные панели. и так далее. Мотивом этого недавнего интереса является возросшая надежность этой теории: быть управляемым данными лучше, чем интуиция, и это активно утверждается разными людьми в различных сценариях использования, таких как огромный успех Amazon и Netflix за счет стратегической данные на основе. Итак, если мы предположим, что эта тема очень интересна и, надеюсь, стоит написать о ней рассказ, тогда давайте сформулируем вопрос, чтобы немного изменить точку зрения, чтобы увидеть более широкую картину: нам нужны точные модели, которые более удовлетворительны, чем наш внутренний голос, так как мы можем гарантировать надежность аналитических моделей, которые мы, несомненно, можем вставить в наш логический поток, помня об этом фрагменте?

Этот вопрос подводит нас к надежности, масштабируемости, устойчивости и эффективности современного состояния науки о данных и смежных областях. Для разных бизнес-вопросов требуются разные метрики точности и структуры отчетности, где решения могут приниматься на очень поверхностном уровне в некоторых случаях использования; однако мы знаем, что это не так в некоторых областях применения, таких как здравоохранение. Насколько мне известно (и я был бы рад получить дополнительную информацию об этом), очень важные решения, такие как хирургическое вмешательство или диагностика, пока не принимаются классификационной моделью. Даже если мы предположим, что искусственный интеллект (ИИ) имеет более высокую точность, чем человеческий аналог (предположим, что точность - это не что иное, как успех в лечении пациента после операции), я все равно очень подозреваю, что существует какой-либо консенсус относительно разрешения алгоритм решает будущее человека. Аналогичный пример можно создать с помощью автономных транспортных средств, где вопрос заключается в том, кто будет нести ответственность в случае возникновения какой-либо проблемы, например, смертельной аварии? Или ненадежность распознавания лиц для выявления преступников, когда люди обсуждают предвзятость данных и, как следствие, несправедливость.

В этой статье я хотел бы представить модель, которую я построил в прошлом году и недавно пересмотрел, чтобы поднять этот вопрос о надежности ИИ, особенно в здравоохранении, которая еще больше увеличилась с распространением вируса Covid p. Эта удивительная статья ясно показывает текущие усилия по диагностике пациентов на основе ИИ и то, как они превосходят людей в задачах классификации, таких как болезни сердца, рак кожи и болезни глаз, но пациенты по-прежнему неохотно принимают ИИ по разным причинам, как показал опрос. Помимо того, что это очень популярная область применения искусственного интеллекта, здравоохранение является отличным примером для обсуждения этих идей, потому что в этой области нет места для ложноотрицательных результатов, как можно было ожидать.

Итак, предполагая, что модели машинного обучения (ML) всегда будут иметь некоторый уровень ложных срабатываний, как мы собираемся найти точки соприкосновения с точки зрения использования? К сожалению, это вопрос, на который я не могу ответить в этой статье, но я твердо верю, что, как практикующие ML, мы должны продолжать поднимать эти вопросы, чтобы вызвать дальнейшее обсуждение и мозговой штурм, которые могут привести нас к потенциальным решениям. Например, если мы создадим модели машинного обучения, которые каким-то образом оцениваются как более точные, чем человеческие проверки, изменит ли это взгляды общества? И мне также интересно, как люди отнесутся к моделям, подобным той, которую я рассматриваю в этой статье, которая представляет собой средство оценки сердечного удара. Остается ли здравый смысл скептичным или есть сдвиг в сторону оптимистического мышления, которое стремится к будущим улучшениям и потенциальным решениям? Вы бы согласились, если бы ИИ поставил диагноз вашему состоянию и лечению?

Модель, которую я представляю в этой статье, представляет собой измеритель сердечного удара, который заинтересовал меня по нескольким причинам. Во-первых, я верю, что искусственный интеллект может внести некоторые изменения в будущую диагностику пациентов, и классификацию сердечного удара можно рассматривать как часть этой широкой проблемы. Диагностика пациента - один из самых строгих процессов в отрасли здравоохранения в целом, и с ним связано множество проблем, таких как человеческий фактор, нестандартизация (разные практикующие врачи могут ставить диагноз по-разному) и ограниченная доступность лечения ( только половина населения мира имеет доступ к услугам здравоохранения ). И, учитывая природу этой проблемы, это отличный кандидат для классификации на основе ИИ. У нас есть проблемы с текущим подходом, очень сложными и умелыми моделями, разрабатываемыми каждый день, растущим объемом данных и, наконец, что не менее важно, очень большой суммой денег, обмениваемой в отрасли. Что мы можем попросить большего?

Что ж, небо - это предел для футуристической философии и последствий ИИ, поэтому позвольте мне поговорить и о некоторой практической работе. Набор данных - это задача хакатона, включающая данные на уровне пациентов с различными состояниями здоровья и двоичную маркировку сердечного приступа, что обеспечивает хорошую игровую площадку для некоторого EDA и классификации. Код и данные доступны на моем Github. Я не буду вставлять много сути / фрагментов кода в эту статью, надеясь, что записная книжка в репозитории будет более удобна для читателя.

Большинству моих друзей-специалистов по анализу данных и мне нравится быстро просматривать необработанные данные, которые помогли мне идентифицировать множество NaN, поэтому давайте посмотрим на недостающую часть, а затем проведем некоторую очистку.

smoking_status       30.626728
bmi                   3.368664
stroke                0.000000
avg_glucose_level     0.000000
Residence_type        0.000000
work_type             0.000000
ever_married          0.000000
heart_disease         0.000000
hypertension          0.000000
age                   0.000000
gender                0.000000
id                    0.000000
dtype: float64
dataset[‘bmi’]=dataset.bmi.fillna(dataset.bmi.mean())
dataset.dropna(inplace=True)
dataset=dataset.drop(‘id’, axis=1)

Поскольку мы только что избавились от недостающих значений, давайте углубимся в корреляции и посмотрим, как некоторые состояния здоровья или связанные параметры могут влиять друг на друга. Я лично считаю, что разработка / анализ функций может оказать значительное влияние на проблемы, связанные со здравоохранением, как показано в этом примере:

Я часто вижу множество графиков корреляции без каких-либо подробных объяснений в различных блогах по науке о данных; однако обычно в этих визуальных эффектах есть что распаковать. Итак, давайте попробуем интерпретировать эти две цифры выше, насколько это возможно, и посмотрим, согласитесь ли вы со мной. Я проанализировал данные (перед очисткой, поэтому может быть очень небольшой сдвиг между этими числами и цифрами, но на самом деле он «небольшой»), отфильтровав в таблице Excel, чтобы нарисовать следующие числа. Что ж, я не думаю, что мы должны придерживаться панд во всем, просто выбор предпочтений.

Исходя из почти повторяющегося вывода, средний уровень глюкозы (AGL) и ИМТ ниже у молодых людей. Неудивительно ... Из 11546 человек, которым меньше 25 лет, перенес инсульт только 3 человека. Думаю, это тоже легко переварить.

Однако есть и другие корреляции, которые будет сложнее интерпретировать. Например, из 34 человек, у которых AGL выше 265, наблюдается только 1 сердечный приступ, и этот человек является 68-летним курильщиком с гипертонией и перенесенным сердечным заболеванием. Не позволяйте этому фрагменту данных вводить вас в заблуждение, соотношение 1/34 составляет почти 3%, что выше, чем общий коэффициент сердечного удара для всего набора данных, который составляет 1,8%, а AGL имеет лишь небольшую корреляцию (~ 0,2) с сердечным ударом. как можно увидеть на графике Пирсона выше. Нам просто нужно полагаться на общий практический принцип при любом анализе данных; все зависит от того, куда вы смотрите ...

Похожий пример: есть 90 человек с ИМТ больше 60, но нет ни одного сердечного удара, но между этими двумя переменными все еще существует небольшое положительное соотношение Пирсона (~ 0,1). Это согласуется с этой ссылкой, в которой четко указано: Связь между избыточным весом и риском инсульта была противоречивой.

Еще одна вещь, которую я хотел бы представить здесь, - это анализ кластеризации основных моментов, который был бы более полезным, если бы у нас не было немаркированных данных. Поскольку мы только что говорили об ИМТ, AGL и возрасте, а также поскольку это числовые столбцы, давайте рассмотрим только эти три параметра, чтобы упростить задачу. Я собираюсь начать с быстрого анализа локтя, основанного на инерции:

А затем, выбрав 2 кластера, я хочу посмотреть на их распределение в 3D-среде:

Меня только интересует, разделили ли Kmeans данные по AGL из-за большего интервала в этом измерении, но я не хочу делать эту статью слишком длинной, обходя кроличьи норы. Я хочу сказать, что я бы назвал синие точки `` группами риска '', если бы у нас не было никаких помеченных данных, и я бы также провел дальнейший анализ возраста, потому что его корреляция Пирсона с сердечным инсультом больше, чем корреляция Пирсона для AGL. против сердечного удара. Учитывая тот факт, что мы не всегда помечаем данные в здравоохранении, особенно в корпоративных приложениях, такой подход мог бы дать некоторое понимание.

Вы тоже чувствуете себя достаточно EDA? Конечно, мы можем построить и обучить модель, а затем сделать некоторые прогнозы прямо сейчас. Поскольку у меня есть несбалансированные данные вместе с некоторыми двоичными / категориальными переменными, я сделал некоторую горячую кодировку, случайную передискретизацию и масштабирование перед загрузкой данных обучения в классификатор. К сожалению, у меня не было достаточно опыта, чтобы задокументировать этот код в прошлом, поэтому, хотя я помню, как тестировал несколько разных классификаторов, у меня нет их результатов. И поскольку случайный лес дает некоторые прилично выглядящие числа, я просто остановлюсь на этом. Вот матрица путаницы:

И в тот раз, когда вы видите 0 ложноотрицательных результатов… Значения точности и запоминания превышают 99,6%… В моей голове звенят колокола, зажигается маленькая искра, которая злобно ведет все мои нервы к одному и только одному выводу: это слишком хорошо, чтобы быть правдой ... Что ж, вероятно, это слишком хорошо, но у меня нет никакого объяснения скептику, который у меня есть в данный момент, и я был бы более чем счастлив услышать отзывы об этом. Когда я смотрю на все 5831 предсказание 0 (отсутствие сердечного приступа), я вижу только 1258 активных курильщиков, 314 сердечных заболеваний и 686 точек данных по гипертонии, поэтому можно утверждать, что модель может быть более склонной к предсказанию отсутствия сердечного приступа только потому, что характеристики набора данных, но это не полное объяснение отсутствия даже одного ложноотрицательного прогноза.

Но, в конце концов, это вся модель, детали, данные, код, и это результат со всей прозрачностью ... Я надеюсь, что не совершил какой-либо серьезной ошибки, которая обманула бы нас этим частично вонючим результатом, но с минимальным количеством ложноотрицательных результатов. это именно то, что специалисты здравоохранения ожидают от приложения искусственного интеллекта. Я не говорю, что ложное срабатывание не является большой проблемой. Придумайте небольшой гипотетический пример, в котором эта модель будет платформой для диагностики пациентов. 24 человека получали бы лечение, в котором они не нуждаются, и тратили бы время и деньги, не говоря уже о горе и разочаровании, которые у них есть. Следовательно, это 0 ложных отрицательных результатов не оправдывает модель для развертывания на производственном уровне, но если мы, как человечество, хотим использовать ИИ для более важных приложений, чем классификация спама, игра в шахматы или механизмы рекомендаций фильмов и выходить за рамки и выше, как диагностика пациента , минимальное количество ложноотрицательных результатов, безусловно, является сильной основой, на которой мы можем развить дальнейший прогресс.

Вот мой любимый абзац, итоги. Что вы можете получить от этой статьи, если дошли до этого места? Несмотря на то, что цивилизация изменила некоторые парадигмы в отношении извлечения информации и принятия решений на основе данных с помощью различных приложений ИИ, некоторые проблемы все еще витают в воздухе. Диагностика пациентов - это проблема классификации на основе искусственного интеллекта, которая в последнее десятилетие вызывает довольно большой интерес как на академическом, так и на корпоративном уровне, и модель оценки сердечного удара, представленная в этой статье, является всего лишь примером высокого уровня с надеждой продемонстрировать некоторые аспекты применения. Как показано с помощью этой модели и результатов, ложные прогнозы могут быть минимизированы, что значительно ниже человеческой точности, и, по моему мнению, отрасли здравоохранения следует сосредоточиться на том, как использовать эти последние достижения, вместо того, чтобы застревать на юридических барьерах и препятствиях подотчетности.

Мне нравится Medium, и еще больше я люблю общаться через Medium, встречаться с новыми людьми, обсуждать новые идеи и знакомиться с новыми историями и перспективами. Концепция открытого исходного кода расширила усилия ИИ, наши знания, и она была построена на общении между теоретиками, практиками и конечными пользователями, как я обсуждал в своей другой статье. Поэтому, пожалуйста, не стесняйтесь подключаться и пинговать меня для дальнейшего обсуждения: