Ретроспектива моего лета в качестве специалиста по данным и того, как летняя программа GSI Technology нарушает статус-кво стажировки.

Наука о данных - это область, в которую сложно проникнуть, особенно если вы студент бакалавриата. Меня зовут Брейден Риггс, и некоторые из вас, читающие это, могут быть знакомы с моими предыдущими блогами, которые посвящены множеству различных тем и проектов в области науки о данных. Однако этот блог будет немного другим. Поскольку мое лето подходит к концу, я хотел написать статью о моем опыте стажировки в GSI Technology, производителе высокопроизводительной памяти из Саннивалле, Калифорния.

Стажировка в качестве специалиста по данным в крупной компании, производящей оборудование, ставит меня на интересный перекресток между жесткой и мягкой стороной технологической индустрии. Я учился на специалиста по анализу данных в Калифорнийском университете в Сан-Диего и в основном занимался программным обеспечением, поэтому я был удивлен, когда увидел возможность на своей доске вакансий в колледже поработать стажером по науке о данных в компании, производящей оборудование.

К моему большому удовольствию и некоторой удаче, я хорошо проинтервьюировал меня и был принят вместе с одним другим на работу под руководством моего теперь уже наставника, руководителя и друга Джорджа Уильямса. Хотя я проводил собеседование с представителями других компаний, меня привлекала представительная натура Джорджа и GSI в целом. Именно его личность заставила меня почувствовать, что моя стажировка будет опытом роста, а не просто винтиком в машине в некоторых из более крупных, более традиционных технологических компаний, с которыми я беседовал. К счастью для меня, мое впечатление было правильным. Я не понимал, в какой степени программа стажировок GSI будет отклоняться от статус-кво, которого я ожидал от многих традиционных программ стажировок по информатике и науке о данных.

Когда я заканчивал весеннюю четверть занятий и готовился к летней работе, бурный и непредсказуемый характер 2020 года поднял свою голову, вынудив программу проходить онлайн. К счастью для меня, программа была быстро адаптирована к онлайн-среде, и я сразу же приступил к работе.

Над чем я работал?

Мой основной и все еще продолжающийся проект был предметом серии блогов, посвященных тестированию приблизительных алгоритмов ближайшего соседа:

Есть еще один блог, который еще не выпущен, который объединит темы. Однако общая суть проекта заключалась в том, чтобы установить базовую производительность для ряда алгоритмов ИНС на традиционном оборудовании, а затем дополнить алгоритмы ИНС некоторым оборудованием GSI, чтобы повысить производительность ощутимым и воспроизводимым образом. Этим оборудованием был блок ассоциативной обработки GSI Gemini® для массивной параллельной обработки данных и вычислений. Этот тип технологии находит применение в ряде областей науки о данных, таких как умножение разреженной матрицы на вектор с привязкой к памяти и поиск ближайшего соседа. Роль науки о данных в этом заключалась, по сути, в обеспечении максимальной надежности и законности эксперимента, что включало работу с рядом алгоритмов, наборов данных, типов файлов и машинных ограничений для проведения эксперимента, который точно и с научной точки зрения показал бы, как включение APU Gemini изменило время поиска ближайшего соседа. Меня вдохновили работать над этим проектом независимо от того, действительно ли Gemini улучшили производительность. Мотивация, лежащая в основе этого, была больше научно-исследовательской, чем бизнес-ориентированной. Если вы хотите узнать о результатах, я добавлю сюда ссылку на блог, когда она будет завершена.

Помимо проекта тестирования ANN, я также работал над рядом небольших побочных проектов. Я не буду вдаваться в подробности обо всех из них, но я расскажу об одном текущем проекте, который мне очень понравился - задача классификации доплеровско-импульсных радаров MAFAT, о которой я также писал в блоге:

Задача представляет собой интересное пересечение академического и делового секторов. Gemini от GSI может ускорить обучение нейронной сети и время поиска и, следовательно, может использоваться в таких задачах, как MAFAT, для улучшения обучения с помощью достаточного тестирования. Хотя проект все еще продолжается, это отличная возможность получить опыт в области машинного обучения и глубокого обучения - областей, которые я изучил и о которых буду узнавать много нового.

Что я узнал из этих проектов?

Помимо универсальных навыков, которые должен был развить каждый, кто работает на дому, я приобрел ряд навыков, которые имеют решающее значение для специалиста по данным, навыков, которые просто невозможно освоить в традиционном классе.

Я был полностью впечатлен уровнем уважения и независимости, который мне оказали, несмотря на мой ограниченный опыт и возраст. В программе учитывалась моя способность учиться, решать проблемы и адаптироваться, при этом всегда гарантируя, что я протяну руку помощи, если она мне понадобится. Эта среда помогла мне учиться и расти как специалист по данным. Это также один из ключевых элементов хорошей стажировки, который упускают из виду многие другие программы. Мои коллеги, которые прошли стажировку или проходят стажировку в других компаниях, часто испытывали клаустрофобию и покровительство, когда им не предлагали тот уровень независимости, который им необходим для обучения и развития в рамках программы. Таким образом, стажировка GSI действительно нарушает статус-кво. На меня возложили ответственность полноценного специалиста по данным до такой степени, что я даже принимал решения, которые повлияли на развитие и результат проекта. Это воодушевляло меня учиться и расти, но темп менялся таким образом, что мне не приходилось перенапрягаться.

Поскольку GSI смогла сломать стереотипы, встречающиеся в более традиционной стажировке, я смог развить и использовать ряд навыков, жизненно важных для роли специалиста по данным. В некоторых случаях мне приходилось решать множество задач, выходящих за рамки моего образования, с возможностью подстраховки на случай, если я буду слишком много бороться. Вот несколько нетехнических навыков, которые я усвоил:

  • Google - ваш друг: во многих случаях я работал над проблемами и проектами, выходящими за рамки моего предыдущего опыта. Это означало, что я столкнулся с множеством проблем, которые не знал, как решить. Поскольку меня поощряли решать эти проблемы самостоятельно, мне приходилось подходить к ним изобретательно и творчески. Это ценный навык, который нужно отточить при работе на любой работе и в любой среде.
  • Коммуникация - ключ к успеху. Одним из ключевых навыков специалиста по данным является умение общаться. В моем случае мне пришлось научиться быстро и кратко сообщать о проблемах, а также передавать ключевые детали множеству коллег. Мне было предложено написать эти статьи для среднего уровня, чтобы улучшить этот навык.
  • Будьте понятны: некоторые проблемы, с которыми я столкнулся, можно было решить разными способами. Задача заключалась в выборе решения, которое было бы простым для объяснения и эффективным. Во многих случаях я или другие люди возвращались бы к коду, который я написал несколько недель или месяцев спустя. Части проекта, включающие простой и интуитивно понятный код, помогли нам решать проблемы быстрее и эффективнее.
  • Упростите проблему: иногда части различных проектов ломались. Возвращаться к устранению этих проблем всегда было сложно, так как было много движущихся частей и вещей, которые могли выйти из строя. Одна из стратегий, которую посоветовал мне использовать Джордж, заключалась в том, чтобы подходить к этим проблемам поэтапно, а не пытаться решать весь набор проблем сразу. Хотя это звучит интуитивно понятно, было много раз, когда мне приходилось ловить себя и сосредотачиваться на постепенных улучшениях, а не на исправлении всего сразу. Эта стратегия гарантирует, что вы не будете перегружены при решении проблемы, и часто приводит к более элегантным и надежным решениям, чем решение, основанное на жюри.
  • Наслаждайтесь тем, чем вы занимаетесь. Летом это была моя постоянная работа и моя первая оплачиваемая работа с полной ставкой. Я узнал, что получение удовольствия от работы имеет большое значение для улучшения качества работы, продуктивности и общего благополучия. Трудно понять, чем вы хотите заниматься, особенно в такой многогранной области, как наука о данных, но это важно, потому что это будет значительная часть вашего опыта.

Как я четко выразился, мне очень понравилось работать в GSI и работать специалистом по данным. Я хотел написать этот блог, чтобы поразмышлять о том, насколько мне повезло, что у меня появилась эта удивительная возможность, и подвести итог тому, чему я научился и чего добился за последние три месяца. Я думаю, что важно ретроспективно остановиться на подобном опыте, поскольку он помогает закрепить навыки, которые я приобрел, и опыт, который я получил. Используя это приключение в качестве ориентира, я чувствую себя гораздо увереннее, вступая в профессиональный мир после моего выпуска в июне этого года. Я лучше понимаю темы, которые хочу продолжить в этом учебном году, и области науки о данных, которые мне будут интересны в дальнейшем. Хотя я уверен, что каждый студент университета стремится пройти летнюю стажировку, я бы посоветовал любым читателям колледжа стремиться к тому, чтобы получить ее еще немного сложнее, поскольку есть множество навыков и опыта, которые вы просто не можете найти в классе .

Если вы хотите прочитать больше из моих работ или узнать о GSI Technology, я добавил несколько ссылок ниже, чтобы проверить это. Кроме того, не стесняйтесь подписываться на меня, если вам нравится мое письмо, поскольку в следующие несколько месяцев я буду углубляться в другие темы науки о данных.

Ссылки и прочее

Все используемые изображения либо созданы мной, либо используются с явного разрешения авторов. Ссылки на материалы автора включены под каждым изображением.