Взгляд на роль данных секвенирования следующего поколения в улучшении лечения рака

Циркулирующая внеклеточная ДНК, сокращенно вкДНК, представляет собой фрагментированную ДНК, выбрасываемую в кровоток всеми клетками организма. У больных раком опухолевые клетки также выделяют свою фрагментированную ДНК в кровь. Эта ДНК из раковых клеток называется циркулирующей опухолевой ДНК, сокращенно цтДНК. в последнее время в центре внимания онкологических исследований была ктДНК, поскольку она содержит всю генетическую информацию о раке пациента, в отличие от биопсии опухоли. Этот биомаркер рака также несет в себе другую информацию, которую можно использовать в качестве функций в моделях машинного обучения для более ранней диагностики рака и более эффективного лечения заболевания. Вот обзор роли втДНК и машинного обучения в улучшении лечения рака.

Прогнозирование устойчивости к химиотерапии с помощью цДНК

Опухоли могут развить устойчивость к лекарствам, используемым для лечения пациента. В онкологии цель персонализированной медицины - выбрать правильную химиотерапию для уничтожения опухолей на уровне отдельного пациента, при этом избегая лекарственной устойчивости. Это можно сделать, изучив генетический профиль опухоли пациента. Сяохун Хан и его коллеги показали, что отслеживание генетических мутаций у онкологических больных с течением времени с помощью ктДНК возможно и может использоваться для индивидуального лечения [1]. Опухоли очень динамичны, поэтому важно отслеживать любые мутации, которые могут потребовать внимания, прежде чем они станут реальной проблемой. Циркулирующая ДНК опухоли является очень удобным биомаркером для этого приложения, поскольку повторный отбор образцов ДНК рака с течением времени является ключом к мониторингу устойчивости к лекарствам, как отметили Хан и его коллеги. Намного легче собрать цтДНК несколько раз, чем ДНК из биопсии, потому что цтДНК находится в крови. Все, что требуется, - это простой забор крови вместо хирургического вмешательства в некоторых случаях.

Машинное обучение и ранняя диагностика рака

Одна из областей, изучаемых с помощью ctDNA и машинного обучения, - это обнаружение рака раньше, чем те тесты, которые у нас есть. Ранняя диагностика рака связана с лучшими результатами для пациентов. Это основная причина скрининга на рак и моего исследовательского проекта на докторскую степень. Если в крови обнаруживается цДНК, у человека прогнозируется опухоль. Проблема заключается в том, что количество ДНК, выделяемой здоровыми клетками, намного превышает количество любой потенциальной опухолевой ДНК, особенно на ранних стадиях рака. Задача моделей машинного обучения - различать ДНК опухоли и ДНК здоровых клеток.

Особенности циркулирующей опухолевой ДНК

Алгоритмы машинного обучения можно разделить на два лагеря: машинное обучение с учителем и машинное обучение без учителя. Для приложений с генетикой рака важны алгоритмы машинного обучения с учителем. Модели машинного обучения с учителем обучаются на помеченных данных, то есть данных с переменными и отображенными выходными данными. Предполагается, что переменные или функции позволяют прогнозировать выходные данные. Модели контролируемого машинного обучения предназначены для прогнозирования вывода новых данных на основе функций, изученных в обучающих данных. С помощью ctDNA модели контролируемого машинного обучения уже обучены мутациям ДНК, длинам фрагментов и особенностям профиля метилирования.

Мутации, наблюдаемые в ctDNA, были использованы Джейкобом Чабоном и его коллегами в модели машинного обучения, направленной на прогнозирование вероятности рака легких [2]. Как отмечают авторы, причиной опухолей являются мутации ДНК или изменения, которые приводят к неконтролируемому росту клеток. Чтобы немного усложнить ситуацию, не все эти мутации вызывают рак, большинство из них совершенно безвредны. Задача моделей машинного обучения - изучить мутации в ДНК, которые позволяют прогнозировать рак по сравнению с доброкачественными. Чабон и его коллеги смогли разработать модель машинного обучения, чтобы точно отличить больных раком на ранней стадии от здоровых людей.

Ранее я упоминал, что здоровые клетки также выделяют ДНК в кровоток. Эта ДНК здоровых клеток отличается от ДНК, выделяемой раковыми клетками, по размеру, это то, что мы подразумеваем под длиной фрагмента. втДНК обычно короче нормальной здоровой ДНК, что делает ее еще одной хорошей функцией для использования в моделях машинного обучения. Эта функция ctDNA была использована в модели машинного обучения градиентного ускорения Стивеном Кристиано и его коллегами [3] и, как было показано, вносит основной вклад в классификацию модели. В результате этой и других работ мой собственный докторский проект будет стремиться включить длину фрагментов ктДНК в модель для прогнозирования рака.

Последняя функция, которую я упомянул, которую можно использовать в моделях машинного обучения для скрининга рака, - это метилирование. Метилирование ДНК - это в основном мечение ДНК химическими группами, которые контролируют процесс обработки ДНК в клетках. Метилирование ДНК в раковых клетках сильно отличается по сравнению со здоровыми клетками. Как и в случае с мутациями и длиной фрагментации, существуют опубликованные модели машинного обучения, которые включают метилирование ctDNA для классификации раковых и неканцерогенных образцов. Huiyan Luo и его коллеги выполнили эту работу, и их результатом стала модель, которая может точно отличить больных раком от здоровых людей [4].

Заключение

Оценивая текущую литературу, становится ясно, что комбинация данных последовательности следующего поколения и методов машинного обучения будет играть ключевую роль в лечении рака. Ученые работают над будущим, в котором данные секвенирования образца крови могут предсказать, разовьется ли у пациента резистентность к лекарству, и на основании этого прогноза будут приниматься клинические решения. Машинное обучение также может сыграть важную роль в улучшении скрининга рака. Раннее выявление рака связано с гораздо лучшими результатами для пациентов. Здесь я только что описал машинное обучение, работающее с данными последовательностей следующего поколения, но есть также возможность включить в модели другие биологические и клинические данные для повышения производительности. Джошуа Коэн и его коллеги продемонстрировали, что добавление белковых биомаркеров к модели машинного обучения может предсказать ткань, из которой возникла опухоль [5]

Использование циркулирующей опухолевой ДНК в моделях машинного обучения для помощи в борьбе с раком является многообещающим, но предстоит пройти долгий путь, прежде чем это станет обычным явлением в клинических условиях. Необходимы дополнительные исследования для подтверждения эффективности моделей, которые уже были описаны в литературе.

использованная литература

[1] Хан, X., Хан, Y., Tan, Q. и др. Отслеживание продольных генетических изменений циркулирующей опухолевой ДНК (цтДНК) при запущенной аденокарциноме легкого, леченной химиотерапией (2019) , Журнал трансляционной медицины

[2] Чабон, Дж. Дж., Гамильтон, Э. Г., Курц, Д. М. и др. Интеграция геномных функций для неинвазивной ранней диагностики рака легких (2020), Nature

[3] Cristiano, S., Leal, A., Phallen, J. et al. Полногеномная внеклеточная фрагментация ДНК у больных раком (2019), Nature

[4] Ло, Х., Чжао, К., Вэй, В., Чжэн, Л., И, С., Ли, Г., Ван, В., Шэн, Х., Пу, Х., Мо, Х., Цзо, З., Лю, З., Ли, К., Се, К., Цзэн, З., Ли, В., Хао, X., Лю, Ю., Цао, С., Лю, В., Гибсон, С., Чжан, К., Сюй, Г. и Сюй, Р., 2020. Профили метилирования ДНК циркулирующих опухолей позволяют раннюю диагностику, прогнозирование прогноза и скрининг колоректального рака (2020), The American Ассоциация развития науки

[5] Коэн, Дж., Ли, Л., Ван, Ю., Тоберн, К., Афсари, Б., Данилова, Л., Дувиль, К., Джавед, А., Вонг, Ф., Маттокс, А., Хрубан, Р., Вольфганг, К., Гоггинс, М., Даль Молин, М., Ван, Т., Роден, Р., Кляйн, А., Птак, Дж., Доббин, Л., Шефер , Дж., Силлиман, Н., Пополи, М., Фогельштейн, Дж., Браун, Дж., Шен, Р., Бранд, Р., Ти, Дж., Гиббс, П., Вонг, Х., Мэнсфилд , A., Jen, J., Hanash, S., Falconi, M., Allen, P., Zhou, S., Bettegowda, C., Diaz, L., Tomasetti, C., Kinzler, K., Vogelstein , Б., Леннон, А. и Пападопулос, Н., 2018. Выявление и локализация хирургически резектабельных раковых образований с помощью мультианалитического анализа крови (2018), Американская ассоциация содействия развитию науки.