Как федеративное машинное обучение может помочь точной медицине.

Машинное обучение уже прочно вошло в нашу жизнь. Машинное обучение влияет на все, от того, как мы делаем покупки, до получения информации. Использование федеративного машинного обучения станет важным фактором точной медицины в будущем. Это связано с тем, что это позволит получать более точные данные и анализ в большем масштабе, чем это было возможно раньше.

Использование ИИ в точной медицине — относительно новая область. Прецизионная медицина — это идея о том, что лечение должно быть персонализировано в соответствии с потребностями здоровья каждого человека, что требует более точных данных. Это также способ решения проблемы того, как обращаться с огромным объемом данных, которые у нас есть сегодня. Было показано, что прецизионная медицина может улучшить результаты лечения онкологических больных на целых 20% и снизить затраты до 50%.

Прецизионная медицина:

  • Позволяет более точно собирать данные
  • Персонализированные процедуры
  • Улучшает результаты лечения

Проблема.

Инициатива точной медицины определяет точную медицину как «новый подход к лечению и профилактике заболеваний, который учитывает индивидуальную изменчивость генов, окружающей среды и образа жизни каждого человека». Основная идея состоит в том, чтобы измерить различия, которые делают каждого человека уникальным в экспрессии генов, поле, образе жизни и влиянии окружающей среды.

Этот подход основан на возможности сбора больших объемов данных о людях и их окружении: их питании, весе, истории болезней, основных личных событиях, когнитивных способностях и местоположении на протяжении всей их жизни.

При таком важном и инвазивном сборе данных конфиденциальность людей имеет первостепенное значение. Данные об образе жизни и здоровье могут быть использованы в гнусных целях или для дальнейшей дискриминации в случае злоупотребления. В зависимости от качества и полноты данных персональные данные имеют высокую ценность на рынке, и, в частности, на черном рынке часты утечки данных. Конфиденциальные данные часто продаются на черном рынке.

Проблемы конфиденциальности данных, строгие правила конфиденциальности и боязнь утечки данных усложнили обмен полными медицинскими данными. Медицинские организации, как правило, не делятся своими данными или делают это в очень ограниченной форме.

Исследования ИИ в здравоохранении зависят от данных хорошего качества; например, четкая картина факторов окружающей среды, связанных с заболеванием, требует объединения многих источников данных из разных мест (разных больниц). Однако защита данных препятствует обмену этими данными, а модели ИИ не могут быть полностью развернуты на ограниченных данных. Иными словами, прецизионная медицина ограничена отсутствием данных хорошего качества; без безопасного места, где можно обмениваться данными, прецизионная медицина не будет процветать.

Решение.

Традиционное решение — создать мощную и безопасную организацию, которая собирает и хранит все данные из каждой больницы в типичной исследовательской среде. Проблема решается путем ее эскалации на более высокий уровень: единый объект, который управляет всеми данными, знает все и, наконец, может извлечь из данных большую ценность. В реальном мире такое решение редко возможно; ни один орган не может собрать все данные и поместить их в базу данных.

У современного ИИ есть мощное решение: перенести вычисления в данные, а не данные в анализ. У каждого организационного узла есть часть вычислений с федеративным методом машинного обучения. Узлы координируют передачу параметров моделирования, а не данных.

Такие решения, как федеративное машинное обучение, предназначены для разделения задачи обучения большой модели между всеми участниками федерации. Данные не будут переданы; только «веса» модели будут перемещаться между центральным узлом, который организует вычисления, и объединенными узлами.

  • Каждый узел сохраняет конфиденциальность своих данных.
  • Каждый узел имеет свою мини-модель того же времени, что и другие узлы.
  • Все узлы вместе способствуют повышению общего уровня точности первичной модели.

Чтобы понять, почему здравоохранение должно инвестировать в эту технологию, мы можем прочитать об экспериментах, проведенных Intel и Пенсильванским университетом, здесь: https://medcitynews.com/2020/05/upenn-intel-partner-to-use-federated -обучение-ИИ-для-раннего-обнаружения-опухоли-мозга/

В этом случае 29 учреждений по всему миру участвовали в глобальной модели ИИ, не делясь своими данными. Ключевой эксперимент (2020 г.), который продемонстрировал применимость этого решения в каждой отрасли со строгими требованиями к безопасности и конфиденциальности.

Ограничения этой технологии: вопрос доверия.

Хотя подход FML намного надежнее и безопаснее, чем совместное использование данных и надежда на лучшее после того, как данные покинут вашу компанию, легко понять, что FML полностью основан на доверии к правильности каждого узла. Скомпрометированный узел может буквально «отравить» модель, изменить глобальный ответ, подделав поддельные данные или поддельные параметры, снизить глобальную точность и даже нанести ущерб, введя ложные ответы.

В то время как сеть организаций здравоохранения, участвующих в федеративном учебном проекте, вряд ли намеренно атакует друг друга, хакер, взявший под контроль узел, может обмануть других и фактически разрушить полезность всего проекта, просто заменив законные данные/параметры поддельными. .

Доверие, конфиденциальность и контроль лежат в основе FML, и правильное управление внутренней кибербезопасностью не является обязательным. Никакая частная и безопасная технология не может справиться со скомпрометированными узлами, оставляя уникальное решение, исключающее поврежденные узлы из федерации.

Прежде чем закончить эту короткую статью, стоит упомянуть отличную библиотеку с открытым исходным кодом, реализующую FML: flower (https://flower.dev), дружественную библиотеку Python, созданную для работы с наиболее известными и распространенными фреймворками ML. (Факел, Tensorflow, MxNet и SciKit Learn). Подобная библиотека реализует несколько стратегий FML, например, не просто централизованную оценку модели, но также и распределенную оценку производительности модели. Этот шаг может смягчить ущерб от скомпрометированного узла, поскольку сеть проверит модель на нескольких узлах перед ее обновлением.

В заключение мы призываем вас внимательно отнестись к внутренней безопасности и построить доверительные отношения с партнерами. Технологии могут помочь; FML здесь, чтобы справиться с конфиденциальностью и создать доверие.

Эта статья является частью информационного бюллетеня, который мы активировали в Linkedin. Зарегистрируйтесь прямо здесь.