Зед А. Шоу: Профессия программиста умеренно интересна. Это может быть хорошая работа, но вы могли бы зарабатывать примерно столько же денег и быть счастливее, управляя фаст-фудом. Гораздо лучше использовать код как секретное оружие в другой профессии. Людей, умеющих программировать в мире технологических компаний, пруд пруди, и они не пользуются уважением. Люди, которые умеют программировать в биологии, медицине, правительстве, социологии, физике, истории и математике, пользуются уважением и могут делать удивительные вещи для развития этих дисциплин.

Это вдохновило меня на то, чтобы рассматривать программирование только как инструмент для достижения большего видения: создать что-то полезное, чтобы помочь пациентам. (Однако я не полностью согласен с цитатой.)

Введение

Мой опыт связан с компьютерными науками (в частности, с машинным обучением), и в этой статье обобщается часть моего опыта после интервью и бесед за чашкой кофе с десятками профессионалов в биотехнологических, медицинских и других компаниях за последние несколько лет. : от стартапов серии A до Unicorns, от Big Pharma до организаций HealthTech в компаниях Pure Tech. Эта статья посвящена перспективам машинного обучения/науки о данных и часто сравнивает биотехнологии/технологии здравоохранения с чистой технологической отраслью.

Отказ от ответственности. Я ни в коем случае не являюсь экспертом/ветераном в этих отраслях и буду намеренно упрощать большую и сложную отрасль. Пожалуйста, исправьте любые неточности, исключения, которые я пропустил, и поделитесь своими мыслями!

Цель. Это первая часть серии статей, посвященных теме машинного обучения в здравоохранении. Это первая статья, обобщающая то, как выглядит карьерный ландшафт в области биотехнологий/медтехники для ролей ML/DS с точки зрения «знания предметной области». Будем надеяться, что он станет ментальным компасом для людей с техническим образованием, которые пытаются попасть в сферу биотехнологий и технологий здравоохранения.

Эта статья для вас, если:

  1. Вы находитесь на ранней стадии карьеры (студент, выпускник, смена профессии и т. д.)

2. Поиск ролей в программном обеспечении — особенно ролей, связанных с машинным обучением/наукой о данных.

и, прежде всего, ваше общее видение состоит в следующем:

Создавайте технологии, чтобы помочь пациентам!

Домены

Чтобы понять возможности ML/DS в сфере биотехнологий/медицинских технологий, вы должны понимать различные домены в этом пространстве, поскольку каждый домен может потребовать совершенно разных знаний. Для общих ролей инженера-программиста это не так важно, поскольку разные домены редко влияют на ваш набор навыков по созданию различных приложений CRUD, масштабированию баз данных, написанию эффективного кода и т. д.

Домены. Поскольку эта статья в основном написана с точки зрения ML/DS, «домены» просто означают тип данных/дисциплину, с которой вы работаете. Вот некоторые из популярных доменов в области биотехнологий/медицинских технологий, которые я сгруппировал и с которыми столкнулся:

Надеюсь, эта таблица покажет вам, как дисциплины, типы данных, приложения продуктов и типы компаний взаимодействуют друг с другом в ролях ИИ для BioTech.

Предметная область имеет большое значение для ролей ML/DS, поскольку знание предметной области часто необходимо для любой части конвейера ML/DS (диаграмма ниже), которая влияет как на разработку машинного обучения, так и на исследования.

Сложный вопрос:

Насколько мне нужны знания предметной области?

Другими словами, сколько мне нужно знать о конкретном домене, чтобы получить работу? Достаточно ли моих общих знаний в области машинного обучения и компьютерных наук, чтобы обобщить их в этой области?

Это зависит, и это определенно будет спектр. Некоторые типы данных на самом деле не требуют знаний предметной области, достаточно ваших знаний в области машинного обучения. Некоторые из этих доменов намного сложнее, чем другие, то есть использование только популярной глубокой нейронной сети не будет работать для определенных типов данных/приложений. Вы больше не можете обойтись толькознаниями в области машинного обучения.

Основываясь на моем личном опыте, знание предметной области гораздо важнее для ролей ML / DS в биотехнологической отрасли по сравнению с чистой технологической отраслью.

Из пяти доменов, которые я привел в качестве примеров, текстовые и графические данные требуют наименьшего количества знаний в предметной области по сравнению с другими перечисленными доменами. Я рассматриваю Computer Vision и NLP как часть общего машинного обучения (я понимаю, что в обеих этих областях могут потребоваться глубокие знания предметной области, особенно если вы проводите исследования в этой области). Тем не менее, Computer Vision и NLP так сильно продвинулись за последние годы из-за обилия графических/текстовых данных (по очевидным причинам), и поэтому почти всегда интегрируются в часть любой учебной программы класса Deep Learning. Многие модели CV/NLP DL могут хорошо обобщать все виды изображений/текстовых данных относительно других областей, перечисленных здесь.

Например, я бы сказал, что любая работа по машинному обучению в геномике требует гораздо большего знания предметной области по сравнению с работой с данными медицинской визуализации / медицинской карты. Вы не можете просто использовать предварительно обученную модель U-Net или BERT и ожидать, что она будет работать с генетическими данными, но вполне вероятно, что это произойдет с данными типа изображения/текста. Кроме того, изображения и тексты естественным образом встроены в наши человеческие системы. Мы знаем, как выглядит изображение собаки и передает ли предложение негативное настроение. Однако маловероятно, что мы сможем сделать то же самое, просто взглянув на необработанную строку строк ACTG или SMILES (см. изображения ниже для пояснений этих типов данных). Для геномики каждая часть конвейера DS: определение проблемы, разработка функций, моделирование и измерение производительности требуют некоторого понимания геномики.

Лучший совет, который я получил от ветеранов отрасли по знанию предметной области из моих кофе-чатов

В то время как требования к знанию предметной области — это спектр ролей ML / DS в биотехнологической отрасли, менеджеры по найму обычно ожидают, что опыт ML является жестким требованием.

«У меня нет большого опыта в области вакцин, но я работаю с людьми, у которых он есть, и наше сотрудничество необходимо для получения наилучших результатов. Я считаю полезным и полезным развивать свои знания в области вакцин, но в большинстве подобных случаев знание предметной области настолько специализировано, что вам приходится учиться на работе, и люди не не обязательно ожидать, что вы придете, зная все. — Инженер по искусственному интеллекту и менеджер по найму в Genentech

«Вся моя команда занимается машинным обучением в здравоохранении, у меня нет биоэкспертизы… В целом, обучение машинному обучению более важно, чем биологическое обучение, даже для многих биоспецифических приложений. И общее мнение в технологической отрасли таково, что специалисты по машинному обучению могут изучать биографию, но специалисты по биотехнологии не всегда могут изучить машинное обучение», — научный сотрудник по исследованиям в области искусственного интеллекта/менеджер по найму в группу НЛП в Genentech.

но если вы хотите проводить передовые исследования в таких областях, как геномика, а не просто получить работу инженера по машинному обучению / специалиста по данным в компании Biotech:

«Когда вы углубляетесь в проблемы, передовые проблемы, вы должны понимать геномику. Вы должны получить лучшее из обоих миров, ведущей областью является секвенирование генома, если вы пытаетесь продвинуться в этой области, вам нужно понимать биологию». — Исследователь геномики в Google и Nvidia

Несмотря ни на что, наличие некоторых доказательств знания предметной области всегда будет иметь большое значение (даже если это всего лишь один небольшой проект, основанный на моем собственном опыте собеседования), поскольку большинство соискателей имеют знания только в области машинного обучения или биологии.

«Поскольку биография компа требует некоторых знаний в предметной области (наземная правда, метрики и т. д.), поэтому этим занимается меньше людей. И вы будете более конкурентоспособны, если будете это делать». — Главный исследователь Calico Life Science (Alphabet).

«В большинстве компаний есть специалисты по машинному обучению и медицине/биологии. Я знаю людей, работающих в PathAI, которые хорошо разбираются в машинном обучении, но имеют опыт работы в сфере здравоохранения. Вы обнаружите, что описания должностей в этих компаниях схожи — требуется базовый опыт машинного обучения, а знакомство с искусственным интеллектом в сфере здравоохранения является плюсом». — Инженер по машинному обучению в Apple, AI Healthcare в Стэнфорде

Еда на вынос:

Различные домены имеют разные уровни входных барьеров. Каждый домен имеет соответствующий набор приложений, дисциплин и типов компаний/отраслей (см. таблицу 1). Выбирайте то, что соответствует вашим личным интересам и обстоятельствам.

Что делать, если у меня нет особого интереса к определенному домену?

Затем вы можете вернуться на шаг назад и посмотреть на некоторые более общие факторы, которые я обычно рассматриваю для любой работы:

  1. Вознаграждение и рост вознаграждения:Вовремя ли я пришел в эту компанию?…
  2. Видение продукта: Действительно ли это тот продукт, которым я горжусь, помогая обществу в течение следующих X лет? Увлечен ли я решением проблемы, которую решает этот продукт? Получаю ли я хоть какое-то право принимать решения по этому продукту?…
  3. Жизненный цикл разработки продукта: продолжительность каждого проекта — от PoC до скорости вывода на рынок. Если я хочу увидеть ощутимый эффект моего продукта на рынке к следующему году, может ли PDLC удовлетворить это личное удовлетворение?
  4. Переносимость навыков: будет ли мой набор навыков востребован в остальной отрасли, если я поменяю работу? Меня интересует роль X. Могу ли я создать смежный набор навыков, чтобы получить роль X?
  5. Команда: Есть ли в существующей команде ученые с опытом работы в предметной области/старшие инженеры, у которых я могу поучиться? Как наставничество? Хочу ли я сейчас быть большой рыбой в маленьком пруду или маленькой рыбой в большом пруду?
  6. Баланс между работой и личной жизнью:смогу ли я по-прежнему получать удовольствие от своих увлечений?

Это всего лишь краткое изложение, я подробно рассмотрю приведенные выше факторы с точки зрения точки зрения возможностей ML/DS в биотехнологии/здравоохранении в другой моей статье: Кадровый ландшафт в сфере технологий. в HealthTech против BioTech против Pure Tech с примерами.»