Полезные ресурсы для ISYE 6501: Введение в аналитическое моделирование — OMSCS Технологического института Джорджии

Это глубокое погружение во все ресурсы для домашних заданий, которые помогли мне получить пятерку в курсе ISYE 6501: Введение в аналитическое моделирование. Если вы еще не видели мой обзор и другие полезные советы по этому курсу, настоятельно рекомендую прочитать эту статью. Это должно помочь определить, подходит ли этот курс для вашего семестра.

Еженедельное домашнее задание

Этот курс требует еженедельных домашних заданий. Да, даже во время экзаменационных недель. При этом они дают вам возможность снизить две самые низкие оценки за еженедельное домашнее задание.

Ниже приведены ресурсы, которые стали очень полезными для выполнения домашних заданий каждую неделю, и я надеюсь, что они помогут вам. Не позволяйте этому поставить вас в рамки, чтобы не исследовать другие ресурсы. Что может быть полезно для меня, может быть что-то, что вы уже знали, и наоборот. Список составлен, чтобы помочь вам в те недели, которые слишком тяжелы для вас, потому что жизнь происходит.

Неделя 1 — Классификация

Охвачены концепции в основном об алгоритмах опорных векторов (SVM) и K-ближайшего соседа (KNN). Я обнаружил, что изучение Учебника по программированию на R действительно помогло мне изучить все тонкости не только языка, но и R-Studio IDE.

Неделя 2 — Проверка и кластеризация

Охваченные концепции в основном об алгоритмах обучения с учителем и без учителя и перекрестной проверке. Лично мне понравилась концепция перекрестной проверки, и я попытался реализовать ее как с циклом for, так и со встроенной библиотекой. Не забудьте изучить этот курс!

«Машинное обучение — R: Как разделить фрейм данных на наборы для обучения, проверки и тестирования? - Переполнение стека"
r — Перекрестная проверка KNN с использованием K-fold — Stack Overflow
Машинное обучение — Вопрос о перекрестной проверке k-кратного числа для KNN с использованием R — Stack Overflow на русском
Перекрестная проверка с использованием KNN. Понимание перекрестной проверки, это… | Дипак Джейн | На пути к науке о данных
Кластерный анализ K-средних · Руководство по программированию UC Business Analytics R (uc-r.github.io)

Неделя 3 — Подготовка базовых данных и обнаружение изменений

Рассмотрены концепции CUSUM, выбросов и обнаружения выбросов с использованием Box-and-Whisker.

Неделя 4 — временные ряды

Рассмотрены концепции ARIMA, GARCH и экспоненциального сглаживания.

Неделя 5 — базовая регрессия

Рассмотрены концепции информационного критерия Акаике (AIC) и байесовского информационного критерия (BIC). Это крайне важно понять, чтобы добиться успеха в этом курсе.

Неделя 6 — Расширенная подготовка данных

Рассмотрены концепции преобразования Бокса-Кокса и то, как можно использовать PCA для уменьшения размерности.

функция prcomp — RDocumentation
Пример PCA с использованием prcomp в R — Python и R Tips (cmdlinetips.com)
StatQuest: PCA в R
«Осыпной участок. Анализ главных компонентов (PCA) — это… | САНЧИТА МАНГЕЙЛ | Середина"
R: Сюжеты (этз.ч)
Уменьшение размерности — Как обратить PCA и восстановить исходные переменные из нескольких главных компонент? - Перекрестная проверка (stackexchange.com)

Неделя 7 — Продвинутая регрессия

Рассмотрены концепции древовидных моделей.

Неделя 8 — Выбор переменных

Рассмотрены концепции как жадных, так и нежадных методов выбора переменных. Жадный включает в себя прямой выбор, обратное исключение и пошаговую регрессию. К нежадным относятся Лассо, Эластичная сеть и Регрессия Риджа.

Неделя 9 — Планирование экспериментов (DoE) и вероятностные модели

Концепции, охватываемые DoE, включали: A/B-тестирование, факториальный дизайн, многорукие бандиты. Для моделей, основанных на вероятности, использовались концепции Пуассона, Вейбулла, экспоненциальной, геометрической и биномиальной моделей.

Неделя 10 — Отсутствующие данные и оптимизация

Рассмотрены концепции вменения данных и типов задач оптимизации (выпуклые, невыпуклые и т. д.).

as.numeric в R: как преобразовать в числовое значение (r-lang.com)
Вменение режима (как вменение категориальных переменных с помощью R) (statisticsglobe.com)
Что такое stepAIC в R?. В R stepAIC является одним из самых… | Ашутош Трипати | Середина"

Неделя 11 — Оптимизация и расширенные модели

Рассмотрены концепции стохастической оптимизации и других продвинутых моделей, таких как процесс естественного языка (NLP), модели выживания, повышение градиента и т. д.

Оставшиеся недели

Неделя 12–14 была анализом тематического исследования, который требовал от вас извлечения ваших знаний из всех предыдущих недель, а неделя 15 была подведением итогов курса.

Другие связанные блоги:

Общий обзор курса и советы: ISYE 6501: Введение в аналитическое моделирование — обзор OMSCS от Технологического института Джорджии и советы
Полезная стратегия экзамена для получения пятерки по курсу: Стратегия экзамена ISYE 6501: Введение в аналитическое моделирование — OMSCS Технологического института Джорджии

Спасибо, что прочитали эту статью. Если вам понравился мой контент, подпишитесь на меня, чтобы поддержать мою работу.