insitro: переосмысление открытия новых лекарств с помощью машинного обучения.

Современная медицина дала нам эффективные инструменты для лечения некоторых из самых серьезных и обременительных заболеваний. Широкое использование вакцин и антибиотиков значительно снизило риск смерти от большинства инфекционных заболеваний во многих частях мира. Противовирусная терапия позволяет пациентам с ВИЧ вести почти нормальную жизнь, а пациенты с гепатитом С теперь могут быть излечены. Передовые методы лечения рака, включая таргетную терапию и иммунотерапию, улучшают долгосрочные результаты для определенных групп пациентов. Последние разработки обещают изменить лечение пациентов с определенными генетическими заболеваниями (такими как муковисцидоз). Тем не менее, многие болезни по-прежнему представляют собой значительную неудовлетворенную потребность, будь то из-за того, что текущие терапевтические варианты обслуживают только небольшую группу пациентов, потому что они только облегчают симптомы, а не устраняют истинную первопричину, или потому, что нет значимого лечения вообще.

В то же время разработка новых терапевтических средств становится все более сложной задачей: показатели успешности клинических испытаний колеблются в пределах среднего однозначного диапазона; затраты на НИОКР до налогообложения для разработки нового препарата (после выявления неудач) оцениваются более чем в 2,5 миллиарда долларов; рентабельность инвестиций в разработку лекарств линейно снижается из года в год, и по оценкам некоторых анализов, к 2020 году она достигнет 0%. Одно объяснение этого феномена состоит в том, что разработка лекарств теперь по своей сути сложнее: многие (возможно, большинство) из низко висящих плодов - мишеней, которые могут быть введены в действие наркотиками, которые оказывают значительное влияние на большую популяцию, - были обнаружены. Если это так, то на следующем этапе разработки лекарств необходимо будет сосредоточить внимание на более специализированных лекарствах, чьи эффекты могут зависеть от контекста и которые применимы только к подгруппе пациентов. Подобрать подходящую популяцию пациентов часто бывает сложно, что затрудняет терапевтическую разработку, в результате чего многие болезни остаются без эффективного лечения, а многие пациенты остаются с неудовлетворенными потребностями. Более того, уменьшенный размер рынка вынуждает амортизировать высокие затраты на разработку по гораздо меньшей базе. Решение этой проблемы не может состоять в том, чтобы мы продолжали платить огромные суммы на разработку новых лекарств, большинство из которых терпят неудачу, а затем перекладывали эти затраты на наших пациентов. Это не является ни экономически устойчивым для общества, ни этичным, поскольку цены на многие новые лекарства недоступны для многих людей, которые в них нуждаются. Мы должны найти другой подход к разработке лекарств.

Как мог бы выглядеть другой подход? Я много лет занимаюсь исследованием машинного обучения (ML) и работаю в этой области 25 лет. Но даже с таким долгим опытом (который изменяет ожидания) я постоянно удивляюсь в наши дни. В настоящее время машинное обучение решает проблему за проблемой, которую я не ожидал решить в течение моей жизни: перевод предложений между языками в условиях, близких к человеческим, распознавание неограниченной речи на нескольких языках, предоставление точных описаний содержания изображений на естественном языке или научиться играть в сложные игры с производительностью, превышающей человеческий уровень. ML трансформирует сектор за сектором экономики, и темпы прогресса, кажется, только увеличиваются.

Эти успехи основаны не только на улучшенных алгоритмах машинного обучения - результат работы многих умных людей за последние несколько десятилетий - но в большей или большей степени на доступности очень больших объемов данных. Такие наборы данных не были доступны в большинстве регионов даже несколько лет назад. А для небольших наборов данных наиболее разумные методы машинного обучения работают аналогично друг другу. Именно доступность все более больших наборов данных позволяет существенно различать производительность разных моделей и открывает двери для творчества тысяч исследователей машинного обучения, чья работа позволила значительно улучшить решения, которые мы находим сегодня.

Обозреватель и писатель New York Times Томас Фридман писал в 2012 году (освещая запуск моего предыдущего предприятия, Coursera), что большие прорывы случаются, когда то, что внезапно становится возможным, встречает отчаянно необходимое. Мы в insitro надеемся, что большие данные и машинное обучение, примененные к критически важной потребности в открытии лекарств, могут помочь сделать процесс быстрее, дешевле и (что наиболее важно) более успешным. Для этого мы планируем использовать как передовые методы машинного обучения, так и глубокие инновации, которые произошли в науках о жизни, которые позволяют создавать большие высококачественные наборы данных, которые могут трансформировать возможности машинного обучения в этой сфере. Космос. Семнадцать лет назад, когда я впервые начал работать в области машинного обучения для биологии и здравоохранения, большой набор данных состоял из нескольких десятков образцов. Даже пять лет назад наборы данных с более чем несколькими сотнями образцов были редким исключением. Сейчас мы живем в другом мире. У нас есть наборы данных о людях (такие как Биобанк Великобритании), которые содержат огромное количество высококачественных измерений - как молекулярных, так и клинических - для сотен тысяч людей. В то же время созвездие замечательных технологий позволяет нам конструировать, изменять и наблюдать биологические модельные системы в лаборатории с беспрецедентной точностью и пропускной способностью.

Используя эти преобразующие инновации, мы планируем собрать и использовать ряд очень больших наборов данных для обучения моделей машинного обучения, которые помогут решить ключевые проблемы в процессе открытия и разработки лекарств. Чтобы включить машинное обучение, мы будем использовать уже собранные высококачественные данные, но мы также будем вкладывать значительные средства в создание наших собственных наборов данных с использованием высокопроизводительных экспериментальных подходов, наборов данных, которые специально разработаны с учетом машинного обучения из самое начало. Затем разрабатываемые модели машинного обучения помогут направлять последующие эксперименты, обеспечивая тесную замкнутую интеграцию методов in silico и in vitro (insitro парадигма).

Чтобы добиться успеха, наши усилия должны объединить дисциплины наук о жизни, инженерии и науки о данных и потребуют значительных инноваций и сотрудничества со стороны экспертов в этих областях. Нам повезло получить сильную поддержку со стороны ведущих инвесторов как в биотехнологии, так и в технологии - ARCH Venture Partners, Foresite Capital, a16z, GV и Third Rock Ventures, которые поделятся своим опытом, их сети и их капитал в этом усилии. В то же время мы также планируем создать замечательную команду, олицетворяющую новый тип культуры, основанную на истинном партнерстве между учеными, инженерами и специалистами по обработке данных, которые будут работать в тесном сотрудничестве для определения проблем, разработки экспериментов, анализа данных и получить идеи, которые приведут нас к новым методам лечения. Мы считаем, что создание этой команды и этой культуры так же важно для успеха нашей миссии, как и качество науки или машинного обучения, которые будут созданы этими разными группами. Работая над сложной и амбициозной целью insitro, мы активно ищем талантливых и увлеченных людей, которые разделяют нашу миссию и видение.

Сегодня вокруг машинного обучения много шумихи с гиперболическими обещаниями, что оно волшебным образом решит все проблемы человечества (и ужасными предупреждениями о том, что это приведет к уничтожению человечества). Мы в insitro не ожидаем, что машинное обучение станет решением всех проблем в разработке лекарств или волшебной пулей, которая поможет найти лечение для каждой болезни. Однако мы считаем, что настало время переосмыслить процесс разработки лекарств с использованием другого и более современного инструментария в надежде, что новая парадигма поможет нам вылечить больше людей, быстрее и с гораздо меньшими затратами.