Осенью и зимой 2021 года я искал новую работу. Моя цель состояла в том, чтобы использовать свои навыки машинного обучения и науки о данных в более приятном секторе. Для этого я в основном ориентировался на био/медицину и климат (может быть, тема другого поста в блоге?) области.

Попутно я поговорил с несколькими учеными, работающими в других областях, которые проявили интерес к моим исследованиям. В результате я решил поделиться списком, который я составил. Этот пост в блоге просто направлен на то, чтобы помочь практикующим врачам DS и ML присоединиться к био-медицине, предоставив им отправную точку. Я также написал кучу глобальных выводов в конце поста.

Хотя я разговаривал со многими из этих стартапов (не со всеми), я не обязательно знаю, чем они занимаются в деталях, и я делаю описание легким, а иногда и нечетким, чтобы избежать передачи какой-либо конфиденциальной информации. Не стесняйтесь нажимать на их имена, чтобы узнать больше на их сайте.

Статья организована следующим образом:

  • Глубокое обучение для медицинских изображений
  • Машинное обучение для обнаружения патологии с помощью других датчиков
  • Клиническая патология
  • Открытие лекарств
  • Генетика / Геномика
  • Увезти

Вот так!

Глубокое обучение для медицинских изображений

Компьютерное зрение недавно произвело революцию благодаря глубокому обучению. В результате многие компании пытаются использовать эти технологии в области медицинской визуализации. Подумайте, например, о радиологии или гистологии.

ИИ обычно используется для диагностики путем обнаружения патологий с использованием детекторов глубокого обучения или моделей сегментации (Yolo, Unet, … или более поздних). Но он также может выходить за рамки характеристики патологии. Например, выполняя измерения с помощью задач машинного обучения, таких как обнаружение ключевых точек (длина поражения кости) или сегментация (например, объем опухоли).

ИИ может улучшить медицинскую диагностику, используя его в качестве второго мнения, чтобы избежать ложноотрицательных результатов. Но чтобы облегчить внедрение технологии, ее часто используют для экономии времени врачей. Примером может служить автоматизация или предложение редактируемых измерений (размер опухоли или поражения, подсчет клеток определенного типа на микроскопическом изображении и т. д.), которые утомительно выполнять вручную. Другим примером является предварительное заполнение диагностических документов до утверждения врачом.

Медицинская визуализация, вероятно, является сектором биомедицины + ИИ, который пользовался наибольшим спросом за последние несколько лет, о чем ясно свидетельствует впечатляющее количество существующих стартапов. Ниже (источник Gleamer) типичный пример того, какой может быть задача ИИ для медицинских снимков: обнаружение поражения на рентгеновском снимке кости.

Итак, вот список, который я придумал:

Gleamer — крупный игрок в области радиологии. Их первый продукт Boneview позволяет автоматически выявлять очаги поражения на рентгенограммах костей. Они опубликовали несколько статей в Радиологическом журнале, с которыми вы можете ознакомиться здесь. Радиология также является основным направлением деятельности Milvue и Azmed.

В довольно тесной области изображений Allison автоматизирует стоматологические задачи, такие как обнаружение и квалификация поражений и имплантатов на панорамных рентгеновских снимках.

Therapixel фокусируется на маммографии. Их продукт уже одобрен FDA и имеет маркировку CE.

Некоторые компании используют МРТ в качестве исходных данных. Pixyl применяет ИИ для обнаружения патологий головного мозга. Точно так же Qynapse помогает врачам в лечении заболеваний ЦНС. Therapanacea хочет улучшить лечение рака с помощью МРТ.

Sonio занимается ультразвуковым сканированием. Следуя наблюдению, что около 50% пренатальных аномалий не выявляются, Sonio создает платформу, чтобы помочь врачам выполнять правильные манипуляции и проверки с учетом синдромов пациента и истории болезни. Глубокое обучение для понимания изображений/видео отсутствует в их первом продукте, но, скорее всего, оно станет следующим шагом.

Primaa фокусируется на гистологии. Платформа призвана помочь клиницистам поставить диагноз (лучше и быстрее). Традиционно в гистологии данные представляют собой изображения клеточной микроскопии. Задачи представляют собой традиционные задачи компьютерного зрения: классификация/сегментация/обнаружение, а также подсчет определенных типов клеток.

Vitadx использует ИИ для обработки изображений, полученных из образцов мочи, для ранней диагностики рака.

Incepto выступает в качестве IA для платформы медицинских изображений, продавая решения партнеров, а также их собственные.

Imvitro хочет помочь эмбриологам выбрать наиболее перспективные эмбрионы, используя изображения/видео развивающихся эмбрионов.

Наконец, если вы ищете британский ИИ научно-фантастического уровня, вы также можете проверить CellVoyant.

Машинное обучение для обнаружения патологии с помощью других датчиков

Изображение — далеко не единственный источник данных о здоровье, который можно использовать с помощью методов машинного обучения. Подумайте об ЭКГ или любых других измерительных приборах.

Апноэ упрощает обнаружение апноэ во сне. Считается, что примерно 1 из 10 людей страдает апноэ во сне, причем большинство из них не подозревают об этом. Апноэ во сне увеличивает, среди прочего, вероятность сердечного приступа и инсульта. Сегодня для выявления апноэ во сне обычно делают полисомнографию. Для этого вы либо отправляетесь в больницу на одну ночь, либо делаете все настройки в лаборатории, прежде чем спать дома. Но есть огромные пробки. В 2002 году время между направлением врача и использованием постоянного положительного давления в дыхательных путях (CPAP) составляло в среднем 14 месяцев в Великобритании! Чтобы решить эту проблему, Apneal предлагает обнаруживать апноэ во сне с помощью стандартного мобильного телефона!

Кардиологи — один из самых успешных медицинских парижских стартапов (они только что были приобретены Philips). Они ориентированы на выявление патологий сердца (наиболее распространенной является аритмия) по данным ЭКГ. Их алгоритм обнаружения позволяет врачу гораздо быстрее собирать часы данных временных рядов. Под капотом используется глубокое обучение, которое обеспечивает большую надежность по сравнению с традиционными методами на основе волн.

Аналогичные типы данных (данные ЭЭГ, ЭКГ и ПСГ) используются Bioserenity для улучшения ухода за пациентами.

В довольно близкой области Implicity основное внимание уделяется созданию платформы для удаленного мониторинга состояния сердца (например, кардиостимулятора). Платформа подключается ко всем данным производителей устройств и делает их доступными в стандартизированном виде. Чтобы пойти дальше, они, вероятно, будут создавать продукты для прогнозирования этих потоков данных с использованием машинного обучения.

Covid явно способствовал росту телемедицины (например, на Doctolib). Чтобы облегчить врачам дистанционную диагностику, некоторые компании, такие как Quantiq и I-Virtual, превращают любой мобильный телефон в медицинское устройство, позволяя измерять в режиме реального времени ключевые показатели, такие как частота сердечных сокращений, частота дыхания или насыщение крови кислородом.

Клиническая патология

Клиническая патология это медицинская специальность, занимающаяся диагностикой заболеваний на основе лабораторного анализа телесных жидкостей, таких как кровь, моча и ткани (Википедия).

Сегодня одной из болевых точек лабораторных анализов является их медлительность. Вот почему такие компании, как Usense (для мочи) или Omini Labs (для крови), разрабатывают продукты с искусственным интеллектом для децентрализации анализа образцов и сокращения времени диагностики.

Kiro предлагает оцифровку биологических отчетов, чтобы информация была легко доступна для пациентов, врачей и лабораторий. Используя эти данные, они смогут / смогут создавать решения на основе ИИ для более качественной и ранней диагностики, как подчеркивается в их партнерстве с Astrazeneca в публикации на связи.

Обратите внимание, что в эту категорию попадают некоторые компании, уже упомянутые в разделе Глубокое обучение и медицинские изображения: Primaa и Vitadx.

Открытие лекарств

Открытие лекарств в последнее время получило большой резонанс благодаря таким объявлениям, как Алфавит запускает компанию по открытию лекарств или IPO Exscientia. Идея не нова и уже некоторое время является предметом исследований во Франции таких компаний, как Dassault Systèmes.

Как правило, проблема решается с помощью:

  • генеративная модель, которая может предлагать новые молекулы. Обычно это можно сделать с помощью генеративных моделей, таких как GAN или LSTM. См., например, эта замечательная статья Aqemia.
  • модель машинного обучения, оценивающая молекулы по эффективности (и множество других ключевых показателей эффективности)
  • активная политика обучения, которая позволяет выбирать следующие эксперименты для запуска, либо искать наилучшие возможные молекулы, либо максимально исследовать пространство поиска.
  • новые данные и метки, проводя эксперименты в реальной жизни или моделируя физику.

Aqemia основан на невероятно быстром квантовом алгоритме, который точно и в 10 000 раз быстрее, чем конкуренты, предсказывает сродство между соединением и терапевтической целью. Это их основная правда. Теперь, если вы хотите получить хорошее представление о том, как генерировать правдоподобные молекулы с помощью машинного обучения, я рекомендую прочитать эту статью, которую они написали.

Iktos — еще одна, более зрелая компания, занимающаяся поиском лекарств.

Схожие идеи, разные приложения: вы также можете взглянуть на Plantik.

NB: Чтобы понять бизнес по поиску лекарств, вам нужно понять, что ценность заключается не в том, чтобы быть поставщиком услуг, а скорее в интеллектуальной собственности. То есть: поиск хорошей молекулы имеет большую ценность, но продажа инструмента, который поможет вам найти ее, может быть не такой прибыльной.

NB: Некоторые компании хотят достичь аналогичной цели, используя омик-информацию (см. ниже).

Генетика / Геномика

Если вы ничего не знаете о геномике, начните с этого разговора. Освежить информацию о различных видах данных (транскриптомика, эпигеномика или…) можно найти здесь.

SeqOne разрабатывает платформу, которая помогает врачам ставить диагноз (например, рак или наследственное заболевание) на основе генетических данных. Их платформа включает подключение к данным секвенатора, оценку качества, стандартные биоинформационные конвейеры и помощь в диагностике.

ADLIN Science создает платформу, упрощающую создание и использование мультиомных данных. В отличие от SeqOne, целевым персонажем является не клиницист, а биолог или исследователь, проводящий исследования. Большая ценность заключается в стандартизации данных между компаниями или командами, поскольку они обычно остаются очень разрозненными. Проще говоря, они хотят стать датаику генетики. Кроме того, они очень дружелюбные люди!

Deeplife хочет использовать глубокое обучение для всех данных omics, чтобы лучше понять, как работают клетки. Конечная цель состоит в том, чтобы иметь возможность предсказывать, как клетки реагируют на лечение, чтобы ускорить поиск лекарств.

One Biosciences фокусируется на использовании секвенирования отдельных клеток для определения новых терапевтических средств. Что такое одноклеточное секвенирование? Что ж, вместо того, чтобы секвенировать миллионы клеток одновременно, каждая клетка сначала изолируется и помечается физическим идентификатором, прежде чем секвенироваться. Итак, для каждого измерения вы получаете таблицу данных подсчета (целые числа) размера (N_cells, N_gene). Технология одиночных ячеек неоднократно использовалась природой (метод года в 2013 и 2019). Многообещающие приложения включают рак и редкие наследственные заболевания.

Другие платформы включают Whitelab Genomics и Epigene Labs.

Ищете работу в Великобритании? Genomics разрабатывает свой продукт Precision Health, который позволяет лучше нацеливаться и лечить людей и популяции, используя их генетический профиль.

Электронное здравоохранение / Другое

Если вы француз, вы, вероятно, знаете Doctolib, так как вы, скорее всего, записались на последние прививки там! Вероятно, у них много тем, связанных с наукой о данных.

Также обратите внимание на компанию Alan, которая начинала как очень эффективная компания медицинского страхования, а теперь постепенно предлагает продукты электронного здравоохранения, такие как Alan Mind или Alan Baby.

Наконец, некоторые стартапы пытаются облегчить жизнь врачей и больниц с помощью платформ/приложений. Примеры включают Lifen и Incepto для упрощения интеграции искусственного интеллекта в больнице, а Synapse и 360 медиков. >» пытаются сделать огромное количество медицинской информации более удобоваримым для врачей.

Увезти

После обсуждения со многими из вышеперечисленных компаний я обнаружил, что у них много общего. Вот несколько выводов о применении машинного обучения в области медицины.

  • Спутать ИИ и приложение. Не используйте ИИ для ИИ. Сосредоточьтесь на потребностях бизнеса. Как правило, в ИИ для медицинских целей это часто означает упрощение и ускорение работы клинициста, а НЕ получение максимальной возможной потери в алгоритме обнаружения. Сосредоточьтесь на практических болях. Для этого многое еще можно сделать без ИИ. ИИ следует использовать для улучшения текущего способа работы. Размышление о том, как правильно интегрировать ИИ в продукт, является обязательным. В противном случае усыновления не произойдет… и вы не получите больше данных.

NB: в совет директоров большинства компаний, занимающихся искусственным интеллектом и медициной, входят врачи. Это не для фигурации.

NB 2: Наличие продукта, который помогает оцифровывать здравоохранение и выигрывать время без ИИ, может быть хорошей стратегией сбора данных для создания ИИ в долгосрочной перспективе.

  • Разработайте один вариант использования, а затем развивайтесь. Создание искусственного интеллекта человеческого уровня требует много времени и сбора больших объемов тщательно отобранных данных. Вы не можете создать компанию, пытаясь найти все источники и создать общую модель. Выберите очень конкретный вариант использования, прибейте его, а затем наращивайте по горизонтали или по вертикали. Пример в радиологии: один тип датчика (сканер/рентген и т.д.), одна патология.
  • Ключевое значение имеет хороший конвейер данных. В машинном обучении данные — это все. В частности, в области медицины это означает, что вам необходимо иметь партнерские отношения с больницами/лабораториями/клиниками для сбора достаточного количества данных. Это также может означать, что для аннотации требуются специалисты, что увеличивает ее стоимость. Эти два момента, как правило, помогают правильному внедрению вашего программного обеспечения. Наконец, способность получать (часто через ваших партнеров) сложные и необычные случаи является ключом к производительности на уровне человека. Именно здесь первостепенное значение имеют концепции машинного обучения и искусственного интеллекта, ориентированного на данные.
  • Рост операций машинного обучения: как и в любом другом секторе, об этом в последнее время все говорят. Два момента, кажется, находятся в центре внимания. а) ИИ, ориентированный на данные. б) оснастка.

Искусственный интеллект, ориентированный на данные — это недавняя концепция, популяризированная Эндрю Нг. Идея основана на том факте, что с последними достижениями в области машинного обучения модели становятся все более и более товаром. Таким образом, часто верно следующее: больше/лучше данных ››› лучшая модель, сделанная на заказ. Это означает, что работа с вашим набором данных обеспечивает большее незначительное улучшение ваших конечных характеристик, чем работа с моделью.

Одна очень важная вещь — собрать правильные данные. Я встретил компанию, которая удвоила объем аннотированных данных, что очень мало повлияло на производительность ее алгоритма. Чтобы улучшить, вам нужно оценить, где модель дает сбой, чтобы вы включили свой канал данных для сбора большего количества этих данных (тяжелые случаи). Именно это и делает Тесла, как вы можете видеть в Переговорах с Карпатами. См. также понятие обучение на основе срезов.

Инструменты: большинству стартапов, созданных более 3 лет назад, приходилось разрабатывать несколько внутренних инструментов, которые теперь имеют зрелые эквиваленты с открытым исходным кодом. Как правило, для управления моделями и данными наиболее распространенными являются MLflow и DVC. В области изображений старейшим стартапам приходилось придумывать самодельные, адаптированные под их нужды, аннотаторы. С другой стороны, новички рассматривают возможность приобретения таких инструментов, как Kili (компания, продвигающая концепцию ИИ, ориентированную на данные) или V7.

  • Маркировка CE и одобрение FDA: это боль, о которой вы не знаете, если не работали в медицинской сфере. В основном он просит вас доказать свою эффективность ИИ с помощью реальных исследований. Зачастую это очень долго и дорого. Кроме того, большинство одобрений относится к одной версии модели. Это означает, что постепенное улучшение версий ИИ невозможно (в отличие, например, от Tesla).
  • ИИ как «сопоставление». Новая тенденция — использовать ИИ в качестве «сопоставления». Допустим, вы хотите измерить статистику нескольких пациентов, но это сложно, долго или дорого. Вы можете использовать ИИ для изучения сопоставления (регрессии или классификации нескольких выходных сигналов) между другим источником, который легче собирать, и интересующей статистикой.
  • Ваш телефон как медицинское устройство: по крайней мере 3 стартапа из приведенного выше списка делают это. Учитывая ситуацию с коронавирусом и рост телемедицины, это, вероятно, станет растущей тенденцией в ближайшие месяцы/годы.
  • Как искать работу в стартапе в области искусственного интеллекта и медицины: прежде всего просмотрите списки стартапов всех инкубаторов. Сюда входят: Agoranov (мой личный фаворит!), Station F, Paris Biotech Santé и Techcare (и многое другое). Если этого недостаточно, рассмотрите возможность просмотра портфолио венчурных капиталистов. Например: Elaia, Серена, Керала ВК, Ibionext, 50 партнеров, или Partech. Наконец, вы также можете ознакомиться с списками FrenchTech.

Заключение

Поздравляю, что зашли так далеко. Поскольку абсолютно невозможно перечислить все французские стартапы в области био/медицины и искусственного интеллекта, я рассматриваю возможность создания совместного списка на github. Если у вас есть предложения о том, как это сделать / какие компании включить, не стесняйтесь комментировать ниже!

Что касается личных новостей, я присоединяюсь к Usense в качестве руководителя отдела обработки данных. На самом деле я ищу стажера для машинного обучения данных мочи. Также мы ищем ведущего разработчика!

Если вы заинтересованы, свяжитесь со мной на linkedin!