Некоторые из первых приложений искусственного интеллекта в здравоохранении были в диагностике — например, это был большой толчок в экспертных системах, где вы стремитесь создать базу знаний, которая позволяет программному обеспечению быть таким же хорошим, как человек-клиницист. Экспертные системы достигли своего пика в конце 1980-х годов, но требовали большого количества знаний для кодирования людьми, у которых было много других дел. Аппаратное обеспечение также было проблемой для ИИ в 1980-х.

Перспектива ИИ в диагностике заключается в том, что вы можете помочь людям в местах, где не хватает врачей. Компьютеры не так изобретательны, как люди, сопоставляющие образцы, но этот факт также означает, что они могут быть более последовательными, чем люди. Таким образом, в дополнение к доступу и доступности существует вероятность того, что врачи с искусственным интеллектом действительно могут добиться лучших результатов, чем те, у кого на шее стетоскопы.

Но как отправить компьютер в медицинскую школу? И куда они идут за кредитами непрерывного медицинского образования?

Доктор Звездного Вояджера — доктор с искусственным интеллектом. Скоро ли он появится?

Диагностика проблем с беременностью

Давайте начнем с примера того, как статистические модели могут прийти к выводам раньше, чем клиницисты. Преэклампсия является ведущей причиной смерти беременных женщин в западном мире и основной причиной осложнений у плода. 15% первых беременностей приходится на женщин с высоким кровяным давлением, и половина из них заканчивается преэклампсией. Чтобы решить эту проблему, вы должны родить ребенка, даже если это сделает его преждевременным.

Проблема в том, есть ли у пациентки преэклампсия или она развивается? Если на самом деле это не преэклампсия, вы хотите начать антигипертензивное лечение. Примером обещания персонализированного статистического здравоохранения является Великова и Лукас (2014). Если их модели будут работать за пределами их небольшого размера выборки, у них будет система, которая будет диагностировать преэклампсию в среднем на 4 недели раньше, чем клиницисты-люди.

В такой работе важен тщательный отбор данных, поскольку легко случайно свалить в одну кучу людей, которые на самом деле не были зарегистрированы как не страдающие преэклампсией. Есть способы быть устойчивыми к зашумленным тренировочным данным, но лучше всего иметь возможность сказать: «Материалы в тренировочной категории A действительно принадлежат этому, а материалы в тренировочной категории B действительно принадлежат туда». Точно так же преподаватели избегают засыпать лекции для студентов-медиков ошибками, ложью и шумом.

Получение согласия

Основное эмпирическое правило заключается в том, что если вы не можете заставить людей договориться о том, как что-то называть, вам будет трудно использовать машинное обучение, чтобы делать это автоматически. Таким образом, важная часть дизайна любого проекта машинного обучения — пилотирование проекта с людьми.

Давайте взглянем на проект в области здравоохранения, реализованный исследователями Beth Israel с помощью CrowdFlower — вы можете прочитать все подробности в их опубликованной статье здесь.

Для различных состояний патологоанатомам необходимо идентифицировать проблемные участки изображений. Это может просто помочь с диагностикой, а также может использоваться в качестве обучающих данных для машинного обучения. На изображении ниже толпу просят нарисовать круги вокруг ядер клеток.

В следующей таблице сравниваются научные сотрудники и толпа с опытными патологоанатомами. Вывод состоит в том, что толпа может довольно хорошо справляться с этой задачей. Вернее, они есть, когда задача хорошо оформлена.

Разработка задачи для людей дает вам данные, на основе которых вы можете обучать модели. Статистические модели точны в той мере, в какой данные обучения в них точны и представляют проблемное пространство. Один из основных способов запутать проблему машинного обучения/науки о данных — сделать так, чтобы людям было очень сложно дать вам хорошую классификацию для ваших обучающих данных. Возможно, категории неоднозначны, описания неясны или противоречивы. Или, может быть, вы просто требуете многого от чьего-то мозга.

Компьютеры не устают, когда вы говорите им искать ядра в огромных изображениях, но люди устают. Предоставление людям изображений размером 400 × 400 пикселей, а не 800 × 800 пикселей увеличивает точность в 2,4 раза и отзыв в 3,0 раза. Вы в принципе не можете получить хорошие результаты, если используете огромные изображения, если, возможно, у вас нет действительно мотивированных экспертов. Даже в этом случае стоит отметить, что сами патологоанатомы, как правило, имеют лишь умеренное согласие между аннотаторами, особенно если их пространство поиска представляет собой утомительно большое изображение.

Точность измерения

Вы также можете использовать глубокие нейронные сети для такого обнаружения, как вы видите в этой работе по обнаружению митоза (разделение клеток). Подход в этой статье получает автоматическую систему с точностью 0,88 и отзывом 0,70. Но опять же, вам нужно дать системе несколько значимых примеров, на которых можно учиться.

Данные для обучения были разработаны экспертами-патологами, которые аннотировали большие изображения. Данные включали 66 000 пикселей митоза и 151 000 000 пикселей без митоза. Другими словами, 0,04% пикселей демонстрируют митоз, в то время как подавляющее большинство пикселей являются просто «фоновыми» пикселями, которые тривиально правильно подобрать.

Что вам нужно выяснить, так это немитотические ядра и другие вещи, которые можно спутать. Например, если бы вы искали зебр, лошади могли бы сбить вас с толку, однако маловероятно, что утки или салат из амброзии сбили бы с толку. Вы должны измерять точность, но если вы каждый раз четко угадываете отсутствие митоза, это будет означать, что вы правы на 99,96%. Это было бы клинически бесполезно или даже опасно.

Другими словами, частью обучения кого-то является его оценка — вы не сертифицируете медицинских работников, начисляя им баллы за правильное написание имени. Вы также не даете им ряд задач, полностью рассчитанных на то, чтобы поставить Домашний очаг в тупик.

Простые вмешательства могут иметь большое значение

Врачи в Дулуте знают, что когда кто-то путешествовал по тропикам, его головная боль может означать совсем другое, чем у большинства их пациентов. Большинство врачей общей практики или врачей скорой помощи вернутся к основному навыку обращения за помощью, и именно здесь в игру вступают исследования и направления.

Врач с искусственным интеллектом не обязан знать все обо всем. И думать о них как о помощниках более реалистично. В большинстве частей мира относительно незначительные вмешательства могут иметь значение. В том же духе рассмотрим чат-ботов.

Довольно просто создавать чат-ботов, которые отправляют напоминания, спрашивают (и записывают) основную информацию и отвечают на общие вопросы. Например, правительство США отслеживает ветеранов, которые проходят курс химиотерапии и выздоравливают дома. Конкретные входные данные для автоматизированной системы могут привести к более активному участию систем поддержки человека. Это может быть полезным способом создания обучающих данных, но эти обучающие данные являются побочным продуктом реальной цели, которая состоит в том, чтобы помочь людям, лицам, осуществляющим уход, и поставщикам медицинских услуг оказывать наилучшую возможную помощь. Врачи с искусственным интеллектом вряд ли заменят врачей в ближайшее время — к этому не готовы ни технологии, ни общество. Но обученные на соответствующих данных и оцененные с помощью значимых мер, врачи ИИ помогут нам расширить лечение.

пс. Первоначально это было опубликовано https://www.crowdflower.com/training-an-ai-doctor/, где вы можете найти все, что угодно об искусственном интеллекте, машинном обучении, обучающих данных и т. п.