Начиная с фона Health Tech

С 2012 года, когда Harvard Business Review объявил Data Scientist самой привлекательной профессией 21-го века, получение работы в области Data Science стало Святым Граалем для многих выпускников компьютерных наук, математики, информационных технологий, статистики и других специальностей STEM. И это неудивительно, так как большинство должностных инструкций для должностей Data Scientist обещают высокие зарплаты, низкий уровень стресса, постоянные возможности обучения, удаленную работу, спокойную и дружелюбную рабочую среду и другие преимущества.

Средства массовой информации и образовательные учреждения (колледжи, университеты и школы кодирования) также широко распространяют информацию о том, что спрос на специалистов по данным превышает количество специалистов, доступных на рынке. Ну, это не совсем так.

На самом деле спрос на специалистов по данным высок, но мест для специалистов по данным без опыта, похоже, нет. Это видно по количеству собеседований на должности Data Scientist, которые значительно ниже числа кандидатов. Кроме того, отборочные собеседования очень конкурентоспособны. Они проводятся в несколько этапов, на которых кандидаты должны продемонстрировать как технические навыки, так и навыки межличностного общения, а также навыки экспертных знаний (обычно приобретаемые только после многолетнего опыта работы).

Итак, как получить должность специалиста по данным, не будучи специалистом по данным?

Очевидный ответ заключается в том, что мы должны начать с чего-то другого. Наиболее распространенные способы — начать с таких должностей, как биостатистик, аналитик данных, администратор базы данных или даже клерк по вводу данных. Другой способ — привести науку о данных к нашему нынешнему положению и преобразовать ее таким образом, чтобы данные занимали значительную часть нашей работы.

Мой случай вписывается в этот последний пример. Однако я должен признать, что не я был тем, кто «навязал» науку о данных в свою работу, а открытие и естественная эволюция моей профессиональной деятельности в соответствии с технологическими достижениями последних 10–12 лет.

Выпускной 2009 года

Моя специальность — технологии здравоохранения (в области клинической физиологии) в Школе технологий здравоохранения в Северной Португалии. Это не причудливое название и не причудливый колледж/университет. На самом деле, некоторые из первых специалистов в этой области имеют даже не диплом, а диплом средней школы или степень бакалавра наук. Я просто делаю эту контекстуализацию, потому что не хочу, чтобы вы думали, что я особенно умен или что я поступил в хороший университет, потому что это неправда. Тем не менее, я всегда был любознательным человеком, который любит учиться и пробовать новое.

2010 Моя первая работа после окончания учебы

Большинство выпускников этой области в конечном итоге работают в больницах, клиниках или фармацевтических компаниях. В конце 2010 года я начал работать во второй по величине больнице в моей стране, но крупнейшей с точки зрения научной продукции. Это также университетская больница, тесно связанная с обучением и исследованиями.

В мои основные обязанности входило проведение диагностических тестов для пациентов, в основном тех, которые требуют использования компьютеров и сложных систем, калибровка этих систем, сбор данных обо всех пациентах и ​​результатов, критический анализ и отчет о результатах, а также ведение базы данных. с обновленными параметрами здоровья/болезни.

Обнаружение статистики с помощью SPSS, 2011 г.

Только спустя несколько месяцев, когда я полностью адаптировался к своей работе, я понял, сколько данных проходит через мои руки. С некоторым важным наставничеством и с бесчисленной помощью людей, работающих со мной, я узнаю, насколько важны эти данные, и какие большие вещи я мог бы сделать с ними.

Бум Data Science еще не начался, и все, что у нас есть, — это статистика. Так я начал изучать статистику. Первое, чему я научился, был описательный анализ, затем я перешел к более интересным темам, таким как сравнения между группами, логические выводы и регрессия. Моим первым программным обеспечением для статистики был SPSS.

Первые гранты 2012 г.

Полученные знания тут же применялись на практике. Итак, в 2012 году, применяя это к данным, которые я собирал, и с моими коллегами, я написал свою первую статью, которую отправил в национальный научный журнал. Статья не только была принята, но и получила первую премию за лучшую статью в своей категории. Сумма, полученная с помощью этого гранта, позволила мне профинансировать мои следующие шаги.

Продвинутый курс по биостатистике, 2013 г.

В 2013 году я поступил в аспирантуру по биостатистике. Этот курс все еще был сложным для SPSS. Однако то, что я помню, было концепциями, которые я изучил, а не используемыми инструментами. Благодаря практическому подходу этот курс помог мне укрепить мои прежние знания в области статистики, научил меня новым концепциям, но, прежде всего, повысил мою уверенность в завтрашнем дне. После этого тренинга я почувствовал себя еще более способным и мотивированным для проведения независимого анализа данных.

В этом году вместе с коллегами я снова подал заявку на тот же приз, который мы выиграли в прошлом году. Угадай, что? Мы снова выиграли его, еще один первый приз в моем резюме! И больше денег, чтобы финансировать мой образовательный путь.

Я также помню, что примерно в это же время я начал замечать, что мои коллеги в больнице приходили ко мне, когда у них возникали вопросы или им нужна была помощь со статистикой. И мне нравилось чувствовать, что со мной обращаются как со «экспертом» и что я могу помочь другим.

Выпускник 2014 г., специалист по методам исследования, начиная с R

В этом году я подал заявку на аспирантуру в области методов исследования, и меня приняли. Основная цель аспирантуры по методам исследования заключалась в том, чтобы обучать концепциям, связанным с исследованиями в более широком смысле, включая этику, рецензирование публикаций и возможности карьерного роста для тех, кто получил степень доктора философии.

Статистика не была основной целью этой программы последипломного образования. Тем не менее, я впервые познакомился с языком программирования R во время этого курса. Я помню, как мне было страшно просто увидеть две-три строки кода и подумать, насколько умным должен быть человек, чтобы понять все это. Мне не нравится пугаться, и, как я уже сказал во вступлении, я любопытный человек, которому нравится узнавать новое. В этом году я изучаю R с единственной целью проведения анализа данных и делаю шаг вперед от SPSS.

2015: серьезное отношение к статистике и анализу данных

В то время я чувствовал, что ко мне уже относятся как к «эксперту» в своей области, в том числе и в статистике. С этим признанием появились две новые возможности. Меня пригласили в команду консультантов по двум интересным исследовательским проектам.

Одним из таких проектов является исследование по оценке параметров здоровья когорты из 5000 детей, наблюдаемых с момента беременности их матери и до взрослой жизни. На этом этапе детям было около 5–6 лет, и им предстояло пройти первую респираторную оценку. В мои обязанности входил выбор оборудования, материалов и расходных материалов, которые будут использоваться в исследовании, обучение и контроль лиц, ответственных за проведение экзаменов, проверка всех экзаменов и отчетов, критическая оценка, надзор и интерпретация результатов. Исследование все еще продолжается, дети оцениваются каждый год, а это значит, что я все еще работаю над этим проектом.

Больше грантов 2016 года и серьезное представление моей работы на всемирных конгрессах

Какой год! В 2016 году, используя данные проектов, которые я начал в 2015 году с оценки респираторных заболеваний детей, я представил свои первые доклады на международный конгресс, один из крупнейших в моей области знаний. У меня 4 статьи приняты как первый автор, и еще 5 приняты как соавтор.

Я также получил грант на проезд к конгрессу, который покрыл все мои расходы на проезд, проживание и регистрацию. Я чувствовал себя по-настоящему VIP, так как международное сообщество оплачивало мои расходы на поездку в другую страну и представление результатов моего исследования. Одной из представленных работ было исследование, в котором была построена модель множественной регрессии для прогнозирования параметров функции легких в детском возрасте для португальского населения, и это до сих пор первый проект такого типа в моей стране.

В этом году я принял участие еще в двух всемирных конгрессах, представляя работу, разработанную с использованием данных из моего больничного отделения. Один из них был проектом, направленным на улучшение рабочего процесса и сокращение времени контакта с пациентом, а другой — на получение доступа и повышение точности диагностики параметра функции легких. С 2016 года я начал активно участвовать в конгрессах и подавать заявки на гранты (и меня чаще всего награждали).

2017 г. Начал работать фрилансером в области анализа данных, изучения SQL

В этом году я начал работать фрилансером в области анализа данных/науки о данных. Я завершил несколько интересных проектов, которые также включали работу в области системной безопасности.

Работая фрилансером, я был счастлив, что «вынужден» исследовать и изучать новые инструменты, такие как реляционные базы данных (mySQL и PostgreSQL). Я использовал SAS в двух проектах. Техническое письмо также было частым запросом от клиентов, и это помогло мне понять, насколько мне нравится писать (и исследовать) технический и научный контент.

2019 г. Знакомство с Python и первые проекты машинного обучения

2019 год стал еще одним годом технологических открытий, обучения и экспериментов. В этом году я начал изучать Python для науки о данных. С Python я также пробовал различные интерактивные среды Data Science, включая популярную Jupyter Notebook и мощный и известный редактор исходного кода VS Code. Позже я влюбился в Google Colab. Я создал репозиторий на GitHub, чтобы систематизировать все мои проекты.

Тот факт, что я изучил Python и начал использовать более сложный код, необходимый для науки о данных (а не только для статистики), заставил меня осознать, насколько мне не хватает навыков информатики. Этот фактор оказал глубокое влияние на мой следующий шаг.

Возвращение в университет в 2020 году

И вот я вернулся в университет. На этот раз я решил серьезно инвестировать свое время в обучение. Я записался на несколько курсов по информатике и математике, включая исчисление 2 и 3 (у меня уже был курс исчисления 1 после моего предыдущего выпуска), линейную алгебру, дискретную математику, императивное программирование (с C), функциональное программирование (с Haskell) и структуры данных (с Джава).

Моей целью было лучше подготовиться к будущему с точки зрения теоретических знаний и лучше понять, что происходит «за экраном», пока я кодирую.

2021: новые идеи, новые взгляды, новые проекты, новые возможности

В 2021 году я начал отскок новых проектов. Мои интересы обратились к машинному обучению и к тому, как его применить к моей работе в Госпитале, что можно улучшить или автоматизировать, какую дополнительную информацию можно извлечь из данных, какие техники можно применить, чтобы выявить преимущества перед существующими. Некоторые примеры включают в себя автоматический контроль качества и составление отчетов о медицинских изображениях, улучшенные методы прогнозирования результатов лечения пациентов, более частое обновление эталонных значений, и этот список можно продолжить…

Все эти вопросы открывают для меня новые возможности, которые требуют много работы, исследований и инвестиций. Одной из самых больших проблем на данный момент является организация сложных баз данных (большие данные) и юридические условия использования этих данных (Европейский закон о защите данных, опубликованный в 2016 году и полностью вступивший в силу с 2018 года).

С другой стороны, растущая доступность и простота анализа, которые предоставляет нам современное оборудование (графические процессоры по более доступным ценам, такие как процессоры M1 Pro или Max, или даже онлайн-сервисы, такие как Google Colab или Kaggle), делают почти обязательным, чтобы разработка программного обеспечения продолжала идти в ногу с этими достижениями и обеспечивает столь же проницательные решения для реализации.

2022 Что дальше?

Продолжение следует…

Заключение и домашние заметки

Вот чему я научился за более чем 10-летний опыт работы:

  • Если вы изо всех сил пытаетесь получить должность Data Scientist, попробуйте начать с другой позиции, а затем смените ее, когда у вас появится возможность.
  • Не стоит недооценивать важность статистики, даже если вы работаете только с AI и ML.
  • Подайте заявку на гранты, даже если вы не уверены, что готовы к этому. Вы никогда не будете.
  • Инвестируйте в непрерывное обучение. Выберите лучшие сертификаты или курсы, которые только можете, но не заполняйте ими все свое резюме. Ваш опыт и прошлые проекты одинаково важны.
  • Посещайте конгрессы в своей области знаний, но активно. Многие конференции позволяют участникам представлять статьи, а авторов можно пригласить представить свою работу и получить финансирование.
  • Попробуйте фриланс. Может быть сложно начать и найти первых клиентов, но вы можете заработать больше дополнительных денег и многому научиться в разных проектах.
  • Это непросто, но постарайтесь быть в курсе инструментов, используемых в науке о данных. Это не значит, что вам нужно знать все, просто выберите некоторые из наиболее часто используемых и придерживайтесь их.
  • Вам не нужна степень STEM, чтобы начать карьеру в области Data Science (однако я рекомендую вам пройти некоторые университетские курсы по математике и информатике).
  • Будьте любопытны, будьте изобретательны и всегда старайтесь находить решения, а не проблемы!

В заключение, чтобы работать, преуспевать и быть счастливым в науке о данных (как и в других профессиях), вам потребуются страсть и автомотивация к тому, что вы делаете. Не каждый день хорош, и мы часто сомневаемся в своей ценности. Возможности не всегда справедливы и равны для всех. Но страсть, целеустремленность, настойчивость и большая сила воли помогают сделать путь таким же вкусным, как и конечный пункт назначения.

Если: вам понравилась эта статья, не забудьте подписаться на меня и, таким образом, получать все обновления о новых публикациях.

Иначе Если: вы хотите узнать больше, вы можете подписаться на членство в Medium с помощью моей реферальной ссылки. Это не будет стоить вам больше, но заплатит мне за кофе.

Еще: Спасибо!