КУРСЫ

Обновлено 12.05.2020: MGT 8803 - Business Fundamentals for Analytics, ISYE 6748: Analytics Practicum (окончил со средним баллом 3.88)

Обновлено 14.12.2020: ISYE 6740 - Computing Data Analytics, ISYE 6644 Simulation

Обновлено 05.08.2020: ISYE 8803 - Специальные темы в многомерной аналитике (средний балл по-прежнему 4.0)

tl, dr: Эта программа стоила каждого цента. С тех пор, как я стал участником этого опыта, я не только экспоненциально вырос в своей области, но и был опубликован, я был докладчиком на конференции GTC Nvidia, я стал наставником учебного курса по науке о данных. Я сделал гораздо больше, чем мог представить в тот день, когда впервые подал заявку.

Весной 2021 года я закончил магистратуру по аналитике Технологического института Джорджии и хотел поделиться своей историей, опытом и отзывами. Я официально поступил осенью 2019 года и закончил программу за 1,5 года. Было волнение, были взлеты (и падения), несколько слез, много бессонных ночей, но в целом это был отличный опыт, и, честно говоря, мне было грустно, когда он подошел к концу. В основном потому, что программа расширяется с каждым семестром. Каждый семестр они добавляют новые курсы в каталог, и легко найти 9 или 10 из них, которые я просто хотел бы иметь возможность пройти во время моего пребывания в программе. Но я здесь, чтобы рассказать о своей истории и опыте, а также ответить на любые оставшиеся у вас вопросы о программе.

Первый вопрос, который я всегда получаю от всех, кто интересуется программой, - «насколько это сложно и насколько сложно пройти?». Что ж, к сожалению, на этот вопрос нет ответа, который подошел бы каждому. Несомненно, существует высокая корреляция между рейтингом школ и стандартами приема / строгостью учебной программы. Итак, давайте посмотрим на это в перспективе. Магистр аналитики - это междисциплинарная степень между Школой промышленной и системной инженерии Стюарта Инженерного колледжа, которая в настоящее время является школой №1 по данным U.S. News.

Scheller College of Business, который в настоящее время является бизнес-школой № 27, но их программа бизнес-аналитики - № 3 (все ваши курсы будут посвящены бизнес-аналитике)

и Школа вычислительной техники и вычислительной техники, Технологический институт Джорджии занимает 8-е место по информатике и 7-е место по ИИ. И то, и другое вы сосредоточите больше, чем системы и теория.

Так что можно с уверенностью предположить, что это не будет прогулка по парку. И я могу это однозначно подтвердить. Единственный ответ, который у меня есть на данный вопрос:

Исходя из вашего собственного опыта, пробег может отличаться.

Правда в том, что в программе принимают участие самые разные люди с самым разным образованием. Вы можете прочитать отзывы почти обо всех курсах на omscentral, но имейте в виду, что отзывы могут исходить от кого-то с более чем 20-летним опытом разработки программного обеспечения. человек с чисто финансовым образованием, который только начал изучать Data Science из МООК на Coursera. Итак, соблюдая все правила, примите то, что я говорю здесь, с мыслью, что мой фон …….

«1 - CSE 6040: ВЫЧИСЛЕНИЯ ДЛЯ АНАЛИЗА ДАННЫХ *»

Я получил степень бакалавра физики от Оле Мисс еще в 2010 году, где я закончил со средним баллом 3,25. Учебная программа, очевидно, была очень интенсивной по математике, но мы также должны были изучать компьютерное программирование на Фортране и C ++. Я очень хорошо учился на обоих курсах, но определенно не стал инженером-программистом. После окончания института я устроился инженером-нефтяником, консультирующим по нефтяным и газовым установкам. В течение этого времени я практически не занимался компьютерным программированием, но был задействован в некоторой аналитике (ничего такого, как Data Analyst или Data Scientist). Я немного не отставал от своих навыков C ++, но даже сегодня я не считал бы себя программистом на C ++.

Примерно в 2015 году я прошел свой первый курс машинного обучения. Как вы, наверное, догадались, это был курс машинного обучения Стэнфорда на Coursera. Если вы еще этого не сделали, но рассматриваете OMSA, сделайте себе одолжение, перестаньте читать это и уходите. Вот ссылка". Пройдя 12-недельный курс за 3 недели (это так хорошо), я продолжил курс Специализация Python для всех, а также Специализация« Прикладная наука о данных в специализации Python ». Оба предложены Мичиганским университетом. Именно на этих курсах я действительно усовершенствовал свои навыки Python. Я прошел эти курсы, продолжая выполнять свою обычную работу. Я прошел еще несколько МООК на Coursera, но, честно говоря, одних МООК недостаточно, чтобы полностью переключить свою карьеру в науку о данных или в мир больших данных. Однако вот краткий список некоторых курсов, которые я прошел.

Spark и Python для больших данных с PySpark
Меня приняли в программу
Программа MM позволяет вам получить кредит до 3 классов в полной магистерской программе. Я получил более 90% в MM и вошел в программу OMSA с кредитом на 3 курса. Одно только это сократило мое время, затрачиваемое на полную программу, по крайней мере, на 2 семестра.
Вычислительная
Бизнес Аналитика

Еще я сделал несколько Kaggles, но, честно говоря, это было не мое. Я чувствовал, что нет ничего оригинального в работе с теми же наборами данных, которые миллионы других людей уже исследовали миллионы раз. Искал что-то более оригинальное и интересное. Именно тогда я присоединился к программе Springboard Data Science Career Track. Это 6-месячный буткемп с гарантией работы в конце. Что действительно привлекло меня в программе, так это то, что они соединили вас с наставником, кем-то, кто является практикующим DS в отрасли, а также с целым персоналом, стоящим за вами.

По завершении учебного курса я не только перешел на роль специалиста по данным в своей компании, но им так понравилась моя работа, что я действительно размещен на их веб-сайте. Вы можете ознакомиться с моим репозиторием на github в программе, чтобы понять, что вы будете делать, если решите присоединиться.

«2 - MGT 6203: Аналитика данных для бизнеса *»

Итак, при полном раскрытии, мне пришлось дважды подавать заявку на участие в программе. Впервые я подала заявку летом 2018 года и опоздала на заявку. К тому времени, как я получил свое заявление и все три рекомендательных письма, это был почти крайний срок для нормального приема. Из-за большого количества претендентов на программу, конечно, мне отказали. Однако это не было чистым отказом, поскольку было добавлено дополнительное уведомление о том, что ваша заявка привлекла наше внимание. Связавшись с приемными, мне посоветовали подать документы намного раньше, а также записаться на Программу Micro Masters. Это оказался отличный совет по двум причинам:

Аналитические инструменты
Финансовый учет - сюда входят такие вещи, как активы, обязательства, собственный капитал, коэффициенты и анализ финансовой отчетности. Фактически на экзаменах нам приходилось вручную рассчитывать / составлять балансы для различных компаний. Для этого вам нужно было знать разницу между различными активами, контр активами, обязательствами, контр обязательствами, а также долгосрочными и краткосрочными обязательствами для всего вышеперечисленного.

В программе 3 разных трека:

Финансы - это касается финансового управления и правил инвестирования, оценки инвестиционных возможностей и стоимости акций, расчета риска, ожидаемой прибыли, стоимости капитала и оценки фирмы.
Маркетинг - сюда входила маркетинговая стратегия, анализ возможностей, сегментация, позиционирование, покупательское поведение, разработка продукта, разработка мест, ценообразование и продвижение.
Управление цепочкой поставок - охватывает долгосрочные, среднесрочные и краткосрочные решения, стратегии распределения, прямую и обратную вертикальную интеграцию и т. Д.

Я выбрал Вычислительный трек, который в основном состоит из всех курсов по информатике для выпускников с добавлением некоторых бизнес-курсов. Большинство моих курсов проводятся со студентами OMSCS.

«2 - CSE 6250: Большие данные для здравоохранения»

Примечание. Это мои мнения и отзывы, основанные на моем опыте. Чтобы заверить вас, что нет никакой скрытой предвзятости в любом негативном высказывании о курсе, обратите внимание, что я закончил обучение со средним баллом 3,88. Таким образом, негативные комментарии связаны с моими истинными чувствами к курсу, а не потому, что я плохо успел по определенному классу. Здесь нет кислого винограда.

В программе MM вы проходите курсы со студентами в OMSA, и это фактический курс программы. По этой причине в мои обзоры будут включены курсы микромастеров. Они будут отмечены * рядом с ними. Я буду добавлять к каждому курсу порядковый номер. Курсы с одинаковым номером означают, что я проходил их одновременно. Я постараюсь отметить, как одновременное посещение двух занятий могло повлиять на мою общую успеваемость.

3 - CSE 6242: Данные и визуальная аналитика

Сложность: 3/5

Удовольствие: 4/5

Обязательства по времени: 8 часов в неделю

Этот курс представляет собой более или менее обзорный курс по множеству аналитических процессов и моделей. Он охватывает все (не очень подробно), от машинного обучения и временных рядов до методов моделирования и оптимизации. Домашние задания были не очень сложными (многие ранее пройденные МООК уже охватывали часть материала, поэтому я пришел к этому курсу с прочной основой), и они были оценены коллегами. Если честно, это вызовет ложное чувство выполненного долга. Получать высшие баллы по HW не было ничего, но экзамены были достаточно сложными. Было 2 промежуточных семестра и финал, которые предполагали гораздо более твердое понимание материала, чем то, что требовалось для домашних заданий. Лекции были хорошо организованы, и я чувствовал, что изложенный материал был удовлетворительным. Мне действительно нравится доктор Сокол и его стиль изложения. Курс в основном на R с разделами моделирования и оптимизации с использованием Python. Задача моделирования заключалась в том, чтобы определить оптимальное количество обслуживающего персонала у стойки регистрации в аэропорту Атланты, чтобы сократить время ожидания до определенной цели. Задача оптимизации была производной от проблемы диеты Стиглера. В целом мне очень понравился этот курс. Получить пятерку не так уж сложно, независимо от вашего происхождения.

3 - CS 7642: Обучение с подкреплением

Сложность: 4/5

Удовольствие: 5/5

Обязательства по времени: до 20 часов в неделю

Этот курс следует переименовать в «Алгоритмы в Python - на стероидах». Этот курс был очень сложным, и я легко мог рассматривать его как курс по отсеиванию тех студентов, которые, вероятно, не входили в программу. Как уже говорилось, мы использовали только Python, и он познакомил пользователя со всеми различными способами использования Python для взаимодействия с данными. В Homeworks использовались Jupyter Notebooks с автогрейдерами, и у вас было 2 недели на их выполнение. Некоторым из них потребовалось целых две недели. Это был очень алгоритмический курс, в котором вам было поручено создать уникальные алгоритмы для решения проблем. В некоторых вопросах для решения проблемы было недостаточно, но это должно было быть эффективное решение. Эти конкретные вопросы были рассчитаны во время выполнения, и если время выполнения было больше определенного порога, вы потерпели неудачу. Мы рассмотрели такие вещи, как использование Python для взаимодействия с базами данных SQL, библиотеку Pandas для манипулирования данными, декомпозицию по сингулярным значениям, а также создание рекомендательной системы с нуля. Было 2 промежуточных семестра и финал, все из которых были ИНТЕНСИВНЫМИ. Они также имеют формат Jupyter Notebook, а также открытые заметки и открытый Интернет (только не открытое сотрудничество). Они позволяют это, потому что каждый промежуточный семестр предназначен только для этого семестра и больше никогда не используется. Так что нельзя просто погуглить ответ. У нас есть 24 часа на завершение первого промежуточного семестра, затем 36 часов на завершение второго промежуточного семестра и финала. На выполнение первого у меня ушло около 8 часов, на второе - 12 часов, и я почти уверен, что потратил почти все 36 часов на завершение финала. Они делают их так, чтобы каждый вопрос основывался на предыдущем. Поэтому, если вы не смогли решить предыдущие задачи, вы не сможете ответить ни на одну из последующих задач. Это заставило вас выполнять каждый шаг последовательно. В целом мне понравился этот курс за сложную задачу. К тому моменту у меня за плечами 3 года программирования на Python, и этот курс все же нашел способы бросить мне вызов. Не проходите этот курс, если у вас 0 опыта работы с Python. Одно дело решать алгоритмы, другое дело решать алгоритмы на языке, который вы никогда раньше не использовали.

4 - ISYE 8803: Темы в аналитике данных большого размера

Сложность: 1/5

Удовольствие: 2,5 / 5

Обязательства по времени: 2 часа в неделю

Скажу честно, я что-то смутно помню из этого курса. Это потому, что я объединил его с, возможно, самым сложным классом во всей учебной программе (см. Ниже этот обзор). Я помню, что он начинается с подробного описания регрессионного моделирования и анализа. Фактически в этом курсе регрессия затрагивалась дважды. Однажды в сфере машинного обучения и, во-вторых, в финансовом анализе - как применить / интерпретировать регрессию к акциям. Эта часть была мне очень интересна. Курс охватывал широкие темы из финансов, маркетинга и цепочки поставок. Домашние задания были не очень сложными и часто дословно повторяли лекции. Время от времени задавали несколько каверзных вопросов, но ничего непреодолимого. Промежуточные и финальные экзамены были открытыми. В целом, у меня нет опыта работы или подготовки, и я потратил минимум времени на этот курс и смог достичь 94%. Я искренне верю, что вынес бы больше из этого курса, если бы смог больше сосредоточиться на нем, но, опять же, я прошел очень сложный курс, который потребовал всего моего времени и усилий.

5 - ISYE 6644: Моделирование

Сложность: 5/5

Удовольствие: 5/5

Обязательства по времени: до 30 часов в неделю

Сложность: 3/5

5 - ISYE 6740 - Аналитика вычислительных данных

Удовольствие: 4/5

Обязательства по времени: до 25 часов в неделю

Сложность: 5/5

Удовольствие: 2,5 / 5

6 - ISYE 6748: Практикум по аналитике

Обязательство по времени: 25 часов в неделю

Сложность: 3,5 / 5

Удовольствие: 5/5

Обязательства по времени: 15 часов в неделю

Заключение

Сложность: 3/5

Удовольствие: 1/5

Обязательства по времени: 5 часов в неделю

До сих пор это был мой самый нелюбимый класс. Им необходимо изменить имя этого класса с «Моделирование» на «Генераторы статистики и псевдослучайных чисел для тех, кто хочет разобраться в теории и проблемах создания собственного моделирования с нуля (но На самом деле никогда не следует создавать такой, потому что уже существуют пакеты, которые генерируют модели лучше, чем вы когда-либо могли) с дополнительным упором на теорему об обратном преобразовании ». Я начну с профи этого класса, который почти такой же, как все, о чем бредят на OMSCentral. Доктор Гольдсман очень забавно читает лекции. Если бы не его личность, я бы вообще не выжил. Он добавляет ровно столько комедии, чтобы лекции были сносными. Однако он действительно злится на Джастина Бибера и Университет Джорджии. Активность ТА на Piazza была отличной, и всякий раз, когда у людей возникали вопросы, ничего не оставалось на простую двусмысленность. И, наконец, все было самодостаточным. Это был один из немногих занятий, на котором не нужно было дополнять лекции дополнительным обучением и ресурсами. Курс состоял из 13 еженедельных домашних заданий с множественным выбором. Они были не очень крутые, все, что нужно было делать, это уделять внимание лекциям. Я обычно нокаутировал их за 2–5 часов сидения. Теперь о минусах. В этом курсе практически не было симуляции. Было от 1 до 1,5 недель, когда вы использовали пакет моделирования арены. Но кроме этого, НАДА. Лекции состояли из некоторых из самых глубоких вопросов по статистике уровней, с которыми мне приходилось сталкиваться, и мы не говорим о бросании кубиков, выборе карт из колоды или проверке гипотез. Вам были предоставлены сумасшедшие многомерные CDF и PDF, в которых вам нужно было дважды интегрировать, чтобы вычислить предельные и условные вероятности. Существовали матрицы Холецкого, броуновское движение, алгоритмы прореживания, распределения Бокса-Мюллера и Коши, ручное вычисление дифференциальных уравнений с использованием метода Эйлера, ручное вычисление производных с использованием методов Ньютона, Таусворта и линейной конгруэнтной оценки и генераторы острова Пустынь и т. Д. И т. Д. И т. Д. Я расскажу вам об одном из вопросов и ответов на экзамене:

«Статистика с Python»

Только представьте себе промежуточные экзамены с 32 вопросами, состоящими только из них, и вы поймете, что это был за класс. Всего было 3 промежуточных семестра. Они были в некоторой степени кумулятивными. В каждом промежуточном семестре основное внимание уделялось лекциям, охваченным вплоть до него, с добавлением нескольких вопросов из прошедших промежуточных семестров. Однако вам разрешается использовать шпаргалку. Также был проект, в котором можно было работать в команде или летать в одиночку. Я сделал симулятор блэкджека с нуля и построил на его основе веб-приложение Dash. В общем, мне было наплевать на этот урок. Я думаю, это в основном было связано с моими надеждами на то, что класс будет этим заниматься. Я подумал, что с таким названием, как «Симуляция», мы будем много этого делать. Как только мой пузырь лопнул на раннем этапе, у меня просто не было мотивации для этого курса. И из-за этого я получил свой первый не пятёрку. У меня B = (. Так что, если у вас 0 фона статистики, 0 фона вычислений, вы определенно захотите избежать этого курса. Если вы тот, кто просто любит статистику, это курс для вас, потому что вы не будет делать никакого реального моделирования.

Сложность: 3/5

Удовольствие: 3/5

Обязательства по времени: 15 часов в неделю

Этот курс является обязательным для всех, кто изучает «Вычислительный трек» в программе OMSA. Это эквивалент OMSA курса машинного обучения OMSCS. В нем было несколько отличных аспектов, но также были и некоторые аспекты. Во-первых, всего было 6 домашних заданий. Первые два были жесткими и отняли уйму времени. Я думаю, что значительная часть студентов бросила курс в течение первых 3-4 недель из-за этих HW. Но как только вы прошли эти первые 2, все пошло гладко. В первом из них было несколько частей, но самая сложная из них заключалась в том, что нам пришлось с нуля кодировать нашу собственную реализацию алгоритма K-medoids для сжатия изображений. Если вы знакомы с K-средствами, вам не понадобится много времени, чтобы освоить K-medoids, но в нем определенно были некоторые хитрые компоненты при кодировании с нуля. Это очень затратный в вычислительном отношении алгоритм. Думаю, я провел неделю в одиночестве, просто пытаясь оптимизировать свою реализацию, чтобы она работала быстрее. Но мне это понравилось. Ниже приведен результат выполнения моего алгоритма сжатия изображений K-medoids для изображения с k = 2, 32 и 256 кластерами.

«Развитие науки о данных со специализацией IBM»

Вы можете увидеть мою полную реализацию «здесь». Вторая сложная HW заставила нас воссоздать результаты на бумаге, используя алгоритм, называемый isomap. Этот метод мы использовали для изображений лиц размером 64x64 и смогли сгруппировать их в 4096-мерном пространстве на основе освещения лица и направления.

Но, как я сказал ранее, как только вы их преодолеете, это будет довольно легко. С шестью домашними заданиями у вас будет две недели на их выполнение. У каждого HW было 3 вопроса, хотя для 3 или 4 HW третий вопрос был дополнительным вопросом, который вам не нужно было задавать. В целом курс охватывал: кластеризацию K-средних и K-medoids, спектральную кластеризацию, PCA и уменьшение нелинейной размерности, оценку плотности, алгоритмы GMM и EM, оптимизацию, наивный байесовский алгоритм, SVM, нейронные сети, обнаружение аномалий, Boosting и AdaBoost, и Случайный лес. Промежуточных экзаменов не было, но был групповой проект. В целом, я ценю этот курс за то, насколько глубоко он углубился в некоторые алгоритмы с точки зрения математической строгости. И почти для всех алгоритмов нам приходилось кодировать их с нуля. Нам разрешили использовать готовые библиотеки (sci-kit learn) по очень немногим вопросам. Из-за этого я определенно ушел с гораздо более глубоким пониманием этих алгоритмов. Моя единственная жалоба - некоторые из этих алгоритмов только что закончили работу. Такие вещи, как SVM, случайный лес, логистическая регрессия и т. Д., Затрагиваются во многих других классах. Между этим курсом и другими курсами очень много общего. Я рекомендую этот курс, но если вы боретесь с математическими выводами и решениями в закрытой форме, вы можете подождать, чтобы пройти этот курс после того, как пройдете несколько других курсов. Кроме того, если у вас 0 опыта в ML, это хороший вводный курс (в некоторой степени), но вы увидите концепции из этого курса в других. Так что вам не повредит, если вы подождете, чтобы взять его.

6 - MGT 8803: Основы бизнеса для аналитики

Сложность: 3/5

Удовольствие: 2,5 / 5

Обязательство по времени: 2 часа в неделю

Я сидел в баре в Атланте рано утром, в день выпуска, со старым другом, с которым я встречался. Каким-то образом мы коснулись темы открытия бизнеса и количества усилий, которые нужно затратить на его ведение. Но не только с повседневной точки зрения, но и с общей картиной, а также с мелкими деталями. Я заставлял его думать, провоцируя прозрение, после того, как размышлял, провоцируя прозрение, когда я обсуждал такие вещи, как централизованные против распределенных цепочек поставок, маркетинг и бизнес-стратегии, методы учета по методу начисления и кассового метода и насколько легко раздуть / снизить стоимость вашей компании с помощью простых оценок активов. . И это было вершиной этого курса (а не самого курса). Этот курс эквивалентен получению степени бакалавра по бизнесу в течение одного семестра. Не дайте себя обмануть заголовком только потому, что в нем есть «Аналитика». Вы почти ничего не будете делать. К сожалению, это один из обязательных курсов независимо от вашего выбора трассы. Я на 100% решительно кричу изо всех сил, прошу администрацию изменить это. Это должно быть факультативом, потому что я чувствую, что зря потратил время и деньги на то, что, вероятно, не буду использовать, и не особо заботился о том, чтобы платить 1000 долларов за обучение. Я начну с положительных моментов курса. Материал хороший. Я не говорю, что курс выполняется плохо. Есть хорошее сочетание предварительно записанных лекций и еженедельных классных встреч, которые длились от 1,5 до 2 часов. (Если вы не можете выделить время для встречи, не волнуйтесь, они записывают их. Очевидно, что у вас просто не будет возможности задать какие-либо уточняющие вопросы во время сеанса). Курс разбит на 5 модулей по 3 недели каждый:

Что касается минусов, меня просто не волновал этот курс, потому что я не записался на MBA, я записался на аналитику, машинное обучение и науку о данных. Это моя самая большая проблема с этим курсом, и его нужно изменить на необязательный. Это заняло только место всех других курсов, которые я хотел пройти, но не смог, потому что это нужно было выполнить.

Сложность: нет

Удовольствие: 5/5

Обязательства по времени: N / A

Бизнес-стратегия - сюда входили экологический анализ, формулировка стратегии, анализ Пестеля, внутренний анализ, дифференциация, руководство по затратам и целям и т. Д.
Это конечно зверь. По сути, это «вся экосистема Hadoop и Spark за один семестр». Вы получаете среды в виде контейнера Docker и запускаете Hadoop Pig, Hive, MapReduce, HDFS, Streaming, а также Spark, Spark SQL, Spark MLLib и Spark GraphX. К счастью, раздел MapReduce для Hadoop был написан на Python, а не на Java (в которой у меня практически не было опыта), но разделы Spark были на 100% Scala. К счастью, до прохождения этого курса у меня был солидный опыт работы с PySpark, и перейти на Scala Spark было несложно, но это все же было проблемой. Вы практически одновременно изучаете новый язык и новую экосистему. Честно говоря, я смотрел, может быть, первые две недели лекций, прежде чем игнорировать их все вместе. Домашние задания были самостоятельными проектами и отнимали очень много времени. Лекции мало что давали для выполнения домашних заданий. Это называется большими данными для здравоохранения, потому что все наборы данных основаны на EHR (Electronic Health Records). Этот курс действительно дает вам представление о том, как стать специалистом по данным / инженером по машинному обучению в области здравоохранения, но все изученные принципы определенно выходят за рамки здравоохранения. Предполагается, что студенты уже имеют достаточный опыт в принципах машинного обучения, принципах глубокого обучения, Linux, командной строке и некоторых распределенных процессах. Если вам чего-то не хватает, не проходите этот курс. В одном из домашних заданий мы вычислили, сколько FLOP было в сверточной нейронной сети определенной архитектуры. Если вы не знаете, что такое CNN и как он работает, вы полностью потерялись. Это не курс машинного обучения, это курс о том, как масштабировать машинное обучение в распределенных системах. Было 4 домашних задания и групповой проект. Моя команда решила принять участие в конкурсе «CheXpert», организованном в Стэнфорде, где мы использовали Spark на кластерах AWS EMR для предварительной обработки около 460 ГБ рентгеновских изображений в 2 ТБ изображений, а затем использовали Tensorflow 2.0 для создания уникальной архитектуры модели для прогнозирования. К сожалению, мы не успели закончить до срока сдачи статьи. В итоге мы обучили 14 промежуточных моделей и одну финальную объединенную модель. Одна эпоха обучения заняла 20 часов на массивном экземпляре графического процессора на AWS, и мы достигли точности 74% всего за 2 эпохи. Я планирую продолжить нашу работу, чтобы попытаться возглавить списки лидеров. Наш семестр был первым, в котором профессор выбрал выпускной. Насколько я помню, это было довольно сложно, но не невозможно. В целом мне так понравился этот класс, что я построил свой собственный кластер Hadoop и Spark из Raspberry Pi 4. Я использовал свой 3D-принтер, чтобы построить корпус кластера.
Это был интересный курс. Мы рассмотрели такие вещи, как использование API для очистки данных и построения графиков социальных сетей, создание интерактивных панелей мониторинга данных с помощью D3.js, использование облачных сервисов Azure и AWS для выполнения обработки MapReduce и Spark, создание алгоритма случайного леса с нуля и определение рейтинга страницы. распределенный алгоритм (без матрицы). Я не уверен на 100%, каким должен был быть этот урок, потому что он бросил вам всего понемногу, но в целом мне он понравился. Было 4 домашних задания, которые, в зависимости от вашего опыта, могут показаться вам просто занятой работой или полным ударом в тыл для вас. Это один из обязательных основных курсов в программе OMSA, поэтому его должны пройти все, независимо от вашего опыта. В нашем классе было более 1000 учеников, и были серьезные жалобы. Если бы вы знали, что делаете, вы бы вырубили HW примерно за день. Если бы вы были на другой стороне спектра, вы бы жили на площади, задавая вопросы без остановки в течение 2 недель подряд. Трудно подготовиться к этому курсу, если вы раньше не сталкивались с этими концепциями, потому что класс охватывает очень многое. К счастью, я работаю специалистом по обработке данных и ежедневно выполняю множество задач. Я выполнял каждое домашнее задание примерно за 2–5 дней. Самым интересным для меня было изучение D3.js. Есть несколько удивительных веб-сайтов, использующих D3.js - «посмотрите здесь» - и было здорово научиться копировать некоторые из этих сайтов. Был групповой проект, который был очень открытым. Вы можете выбрать свою тему, данные и метод презентации. Единственным жестким требованием было то, что данные должны быть значительного размера (но не жестких требований к тому, какой это размер, ха-ха). Наша команда создала веб-сайт Scrollytelling, используя данные о Второй мировой войне, собранные из более чем дюжины источников. К сожалению, один из членов нашей команды пропустил дистанцию на полпути и оставил нас в подвешенном состоянии. Нам не удалось завершить то, что мы намеревались сделать, но мы все же сделали достаточно, чтобы получить 100 баллов по финальному проекту. Я размещаю сайт на своем личном сайте AWS, вы можете проверить это «здесь». В целом, мне понравилось это занятие. Вы обязательно познакомитесь со многими техниками. Я просто немного не понимаю, какова должна была быть основная цель этого курса. Я старался не тратить на это слишком много времени, потому что соединил его с обучением с подкреплением, и позвольте мне сказать вам вот что - я не был таким несчастным с тех пор, как проводил двухдневные футбольные тренировки при 100-градусной погоде.
Я начну обзор с этого, мне, вероятно, он понравился бы больше, если бы я прошел этот курс отдельно. Но, к сожалению, я был обжорой наказания и соединил его с CSE 6242. Я процитирую одного из моих одноклассников по этому курсу, описав его как «марафон». Количество материала и глубина, на которую он покрыт, просто смешны. В этом курсе много теории, доказательств, теорем сходимости, статей и приложений. Честно говоря, чтобы хоть немного разобраться в происходящем, мне пришлось дополнить лекции и чтения лекциями «Дэвида Сильвера из Google DeepMind» (ребят, которые обучили агента обучения с подкреплением играть в видеоигры Atari лучше, чем люди. ). Было 6 домашних заданий, 3 проекта и финал. Домашние задания были довольно сложными, но их можно было решить за день. Первый проект воспроизводил результаты эксперимента с опубликованной статьей. Это было сложно, потому что в исходной статье было упущено так много деталей о том, как воспроизвести эксперимент. Малейшее изменение в реализации дико меняет результат. Второй эксперимент был немного более открытым и веселым. Нам пришлось решать проблему лунного посадочного модуля из среды OpenAI Gym. Я использовал Deep Q Learning with Memory replay и Tensorflow 2.0, чтобы обучить агента приземлиться на Луну. Однако одного решения проблемы было недостаточно. Вы должны были предоставить глубокий анализ выполнения действий вашего агента на основе метода, используемого для решения проблем среды. 3-й проект сломал меня. Опять же, вам пришлось повторить результаты из опубликованной статьи. Этот проект был посвящен теории игр и футбольной среде. Вам приходилось кодировать футбольную игру с нуля (вы можете увидеть мою реализацию игры ниже) и всю динамику игры в соответствии с правилами, описанными в исходной статье (которые снова были неоднозначными). Затем вам нужно было обучить двух конкурирующих агентов действовать в соответствии с 4 различными подходами теории игр {Q-обучение, Friend-Q, Foe-Q и CEQ}. Главный вывод заключается в том, что для Foe-Q и CEQ требовался алгоритм, который использовал линейное программирование для оптимизации поведения агентов. Курс читают Чарльз Исбелл и Майкл Литтман, профессор Университета Брауна, и их лекции были интересными. Просто объем пройденного материала был слишком большим для одного семестра. Я получил 100 баллов за все, кроме финала, который был верным / неверным с обязательным объяснением. Я получил 72 балла, но в среднем по классу 52 балла, чтобы вы могли понять, насколько это было тяжело. Однако у этого курса есть большой изгиб. Я считаю, что из статистики, которую я видел на слабине и пьяцце, любой, кто был в среднем по классу или выше, автоматически получил А. Опять же, если бы я брал это отдельно, мне, вероятно, он понравился бы больше. RL - удивительное поле, которому некуда идти, кроме как вверх. Я был поражен, наблюдая, как мой маленький агент сам приземлился на Луну и насколько просто было научить его это делать. А ребята из DeepMind делают сумасшедшие вещи: «они обучили агента побеждать профессиональных игроков в Starcraft».
Это класс прямо здесь !! Это, несомненно, лучший курс, который я получил за всю программу до сих пор. Прежде чем я расскажу почему, позвольте мне сначала убрать негатив с дороги. Чтобы по-настоящему оценить этот урок, вы должны пройти его отдельно, чтобы вы могли посвятить все свое время и внимание не только «получению» материала, но и полному его усвоению и пониманию. На это есть две причины. Во-первых, это тяжелый курс по математике и математическим обозначениям. Мы не говорим просто об умножении и сложении, мы говорим о произведениях Кронекера и Хатрирао матриц, N-сторонних тензорных разложениях и решениях в замкнутой форме для выпуклых оптимизаций. Если вы этого не делаете или вообще не видели, потребуется немного времени, чтобы оно впиталось. Во-вторых, лекции не лучше всего объясняют математику (на мой взгляд). По большей части профессор просто бросал уравнения и доказательства на слайд и много крутил от руки «как мы видим, это относится к этому… .это означает это…. И т. Д.». Следующий минус, который у меня есть, заключается в том, что время отклика со стороны ТА оказалось недостаточным. Это меня удивило, так как на omscentral это был один из самых больших рейвов курса, уровень активности преподавателей и профессора. Думаю, я видел, как профессор появлялся на площади только тогда, когда ТА специально задавал ему вопрос, на который они не могли ответить. Что касается ТА, я скажу, что время ответа могло иметь какое-то отношение к перетасовки ТА, которая случайно произошла в начале семестра. Но точно не знаю. Последняя жалоба, которую я имею, заключается в том, что экзамены были сформулированы ужасно и двусмысленно до такой степени, что большинство учеников не могли даже понять, о чем спрашивали некоторые из вопросов. Добавьте к этому медленное время отклика ТА, и вы получите рецепт для довольно разочарованных студентов. Теперь о величии этого курса. Этот курс действительно походил на курс для выпускников. В домашних заданиях и на экзаменах было хорошее сочетание выводов и приложений. Было 5 домашних заданий, каждое из которых содержало от 3 до 4 вопросов. У вас есть около 1,5 недель на их выполнение, но вы можете выполнить их за пару дней, если сядете и сосредоточитесь. Если бы вы могли выполнять домашние задания, сами экзамены не были бы такой сложной задачей. Нельзя сказать, что они не были сложными. Поистине замечательная вещь в этом курсе - это сами темы. В этом курсе представлено множество замечательных техник и аналитических методов, которые должны привлечь НАМНОГО БОЛЬШЕ внимания, чем некоторые методы, используемые в повседневных курсах машинного обучения. Мы рассмотрели такие вещи, как функциональный анализ данных, сглаживающие сплайны, b-сплайны, сжатие изображения, увеличение изображения, разложение тензора CP, разложение тензора Таккера, вейвлеты, завершение матрицы, обнаружение аномалий с помощью ограничений разреженности, оптимизация ядерных норм, измерение сжатия, разложение сигнала и т. Д. Так как я прошел курс летом, у нас не было возможности охватить два модуля методов оптимизации, но лекции и домашние задания были доступны для самообучения. Но что касается того, что было рассмотрено, мы не только «покрыли» их, но и глубоко погрузились в математику, выясняя, почему они такие, какие они есть, и почему они делают то, что делают. Анекдотический пример: я всегда знал, что регуляризация L1 привела к тому, что функции имели разреженные коэффициенты при оптимизации. Этот курс не только наглядно покажет вам, почему, но и математически, и это будет иметь абсолютный смысл. Затем вы также увидите другие полезные методы регуляризации L1 и L2, помимо попыток подобрать регрессионные модели. Думаю, мне следует добавить эту часть к отрицательной стороне, но для некоторых это может быть положительным моментом, но будьте готовы вывести решение в закрытой форме для нескольких вариантов задачи обыкновенных наименьших квадратов (OLS). Я мог долгое время не видеть шляпы или матрицы проекции. В общем, сделайте себе одолжение и пройдите этот курс. Просто возьмите его отдельно, чтобы вы могли по-настоящему оценить его.

Это кульминация всей вашей тяжелой работы. Здесь у вас есть шанс претворить теорию в жизнь. Это прикладной практикум. Чтобы получить право на этот курс, вы должны пройти не менее 8 курсов, и 3 из 8 курсов должны быть базовыми. Как только вы пройдете квалификацию, вы получите электронное письмо от отдела, информирующее вас об этом. Затем вы должны решить, собираетесь ли вы выполнять проект, спонсируемый работодателем, или поручить вам проект от одной из компаний-партнеров Georgia Tech. Поскольку я уже работаю специалистом по анализу данных, я выбрал проект, спонсируемый работодателем. Есть видео, которые вы должны посмотреть в рамках этого курса, но по большей части вы потратите свое время на работу над своим проектом. Об этом курсе особо нечего сказать, за исключением того, что вы из себя представляете. Работа, которую я проделал для своего проекта, в конечном итоге была опубликована в крупном журнале в моей отрасли. Мне даже удалось выступить на норвежской конференции. Революционные результаты, которые я получил, основаны на реальных методах, которым я научился в моем самом любимом курсе ISYE 8803: Аналитика многомерных данных. Вы можете увидеть аннотацию к моей статье здесь:

«Специализация глубокого обучения»

«IMoDD: Интеллектуальное картирование скважинной динамики
Симс, Келли Скотт, Бомиди, Джон Абхишек, Мосс, Уильям Энтони и Томас Эндрю Уилсон. «IMoDD: интеллектуальное картографирование… onepetro.org»

Эта программа стоила каждого цента. С тех пор, как я стал частью этого опыта, я не только экспоненциально вырос в своей области, но и был опубликован, я был докладчиком на конференции Nvidia GTC, я стал наставником для буткемпа. Я сделал гораздо больше, чем мог себе представить в тот день, когда впервые подал заявку.

Georgia Tech OMSA: мой обзор программы (на данный момент)

tl; dr Я делаю обзор своего пути к участию в программе OMSA Технологического института Джорджии - онлайн-магистратуре в области аналитики

Мой фон

«Полное руководство по TensorFlow для глубокого обучения с помощью Python»

ПРИМЕНЕНИЕ

КУРСЫ

«1 - CSE 6040: ВЫЧИСЛЕНИЯ ДЛЯ АНАЛИЗА ДАННЫХ *»

«2 - MGT 6203: Аналитика данных для бизнеса *»

«2 - CSE 6250: Большие данные для здравоохранения»

3 - CSE 6242: Данные и визуальная аналитика

3 - CS 7642: Обучение с подкреплением

4 - ISYE 8803: Темы в аналитике данных большого размера

5 - ISYE 6644: Моделирование

5 - ISYE 6740 - Аналитика вычислительных данных

6 - ISYE 6748: Практикум по аналитике

Заключение

«Статистика с Python»

«Развитие науки о данных со специализацией IBM»

«Специализация глубокого обучения»

«Полное руководство по TensorFlow для глубокого обучения с помощью Python»

Вопросы по теме