Это глубокое погружение во все ресурсы для домашних заданий, которые помогли мне получить пятерку в курсе ISYE 6501: Введение в аналитическое моделирование. Если вы еще не видели мой обзор и другие полезные советы по этому курсу, настоятельно рекомендую прочитать эту статью. Это должно помочь определить, подходит ли этот курс для вашего семестра.
Еженедельное домашнее задание
Этот курс требует еженедельных домашних заданий. Да, даже во время экзаменационных недель. При этом они дают вам возможность снизить две самые низкие оценки за еженедельное домашнее задание.
Ниже приведены ресурсы, которые стали очень полезными для выполнения домашних заданий каждую неделю, и я надеюсь, что они помогут вам. Не позволяйте этому поставить вас в рамки, чтобы не исследовать другие ресурсы. Что может быть полезно для меня, может быть что-то, что вы уже знали, и наоборот. Список составлен, чтобы помочь вам в те недели, которые слишком тяжелы для вас, потому что жизнь происходит.
Неделя 1 — Классификация
Охвачены концепции в основном об алгоритмах опорных векторов (SVM) и K-ближайшего соседа (KNN). Я обнаружил, что изучение Учебника по программированию на R действительно помогло мне изучить все тонкости не только языка, но и R-Studio IDE.
- Учебник по программированию на R — Изучите основы статистических вычислений — YouTube
- Машинное обучение — Каково влияние C на SVM с линейным ядром? - Перекрестная проверка (stackexchange.com)
- предварительное исчисление алгебры — Получить коэффициенты прямой из 2 точек — СпросиСеть по математике
- (PDF) Применение алгоритмов машинного обучения в прогнозировании дефолта по кредитной карте (researchgate.net)
Неделя 2 — Проверка и кластеризация
Охваченные концепции в основном об алгоритмах обучения с учителем и без учителя и перекрестной проверке. Лично мне понравилась концепция перекрестной проверки, и я попытался реализовать ее как с циклом for, так и со встроенной библиотекой. Не забудьте изучить этот курс!
- «Машинное обучение — R: Как разделить фрейм данных на наборы для обучения, проверки и тестирования? - Переполнение стека"
- r — Перекрестная проверка KNN с использованием K-fold — Stack Overflow
- Машинное обучение — Вопрос о перекрестной проверке k-кратного числа для KNN с использованием R — Stack Overflow на русском
- Перекрестная проверка с использованием KNN. Понимание перекрестной проверки, это… | Дипак Джейн | На пути к науке о данных
- Кластерный анализ K-средних · Руководство по программированию UC Business Analytics R (uc-r.github.io)
Неделя 3 — Подготовка базовых данных и обнаружение изменений
Рассмотрены концепции CUSUM, выбросов и обнаружения выбросов с использованием Box-and-Whisker.
- Тест Граббса на выбросы — Тестирование на выбросы с помощью R — YouTube
- «r — Как повторить тест Граббса и пометить выбросы — Qaru
- Тест на нормальность в R — Понятные руководства — Wiki — STHDA
- Учебник по R: проверка крайностей с помощью теста Граббса
- plot — Наложение нормальной кривой на гистограмму в R — Stack Overflow на русском
- функция grubbs.test — RDocumentation
- Плавление и литье в R — DataScience Made Simple
- Краткий обзор qcc (r-project.org)
Неделя 4 — временные ряды
Рассмотрены концепции ARIMA, GARCH и экспоненциального сглаживания.
- Простое экспоненциальное сглаживание | На пути к науке о данных
- 7.3 Сезонный метод Холта-Уинтерса | Прогнозирование: принципы и практика (2-е изд.) (otexts.com)
- Функция Хольта-Винтерса — RDocumentation
Неделя 5 — базовая регрессия
Рассмотрены концепции информационного критерия Акаике (AIC) и байесовского информационного критерия (BIC). Это крайне важно понять, чтобы добиться успеха в этом курсе.
- функция lm — RDocumentation
- 4 примера использования линейной регрессии в реальной жизни — Statology
- Как получить значение среднеквадратической ошибки в линейной регрессии в R — Cross Validated (stackexchange.com)
- Объяснение резюме lm() в R — Learn by Marketing
Неделя 6 — Расширенная подготовка данных
Рассмотрены концепции преобразования Бокса-Кокса и то, как можно использовать PCA для уменьшения размерности.
- функция prcomp — RDocumentation
- Пример PCA с использованием prcomp в R — Python и R Tips (cmdlinetips.com)
- StatQuest: PCA в R
- «Осыпной участок. Анализ главных компонентов (PCA) — это… | САНЧИТА МАНГЕЙЛ | Середина"
- R: Сюжеты (этз.ч)
- Уменьшение размерности — Как обратить PCA и восстановить исходные переменные из нескольких главных компонент? - Перекрестная проверка (stackexchange.com)
Неделя 7 — Продвинутая регрессия
Рассмотрены концепции древовидных моделей.
- Деревья регрессии · Руководство по программированию UC Business Analytics R (uc-r.github.io)
- Регрессия случайного леса в R: код и интерпретация
- Случайные леса
- Функция randomForest — RDocumentation
- 4 примера использования логистической регрессии в реальной жизни
- Как выполнить логистическую регрессию в R
Неделя 8 — Выбор переменных
Рассмотрены концепции как жадных, так и нежадных методов выбора переменных. Жадный включает в себя прямой выбор, обратное исключение и пошаговую регрессию. К нежадным относятся Лассо, Эластичная сеть и Регрессия Риджа.
- Основы выбора модели в R
- Введение в glmnet
- K-кратная перекрестная проверка в R (шаг за шагом) (statology.org)
- Разница между glmnet() и cv.glmnet() в R?
- Кросс-валидация для glmnet
Неделя 9 — Планирование экспериментов (DoE) и вероятностные модели
Концепции, охватываемые DoE, включали: A/B-тестирование, факториальный дизайн, многорукие бандиты. Для моделей, основанных на вероятности, использовались концепции Пуассона, Вейбулла, экспоненциальной, геометрической и биномиальной моделей.
- Дизайн примеров экспериментов и приложений
- FrF2: Функция для обеспечения регулярных двухуровневых планов Fractional Factorial
- DoE 64: Создание дробных проектов в пакете R — FrF2
- Симулятор с Ареной — 1
- Компьютерные лаборатории в GT вместо того, чтобы скачивать Arena локально
Неделя 10 — Отсутствующие данные и оптимизация
Рассмотрены концепции вменения данных и типов задач оптимизации (выпуклые, невыпуклые и т. д.).
- as.numeric в R: как преобразовать в числовое значение (r-lang.com)
- Вменение режима (как вменение категориальных переменных с помощью R) (statisticsglobe.com)
- Что такое stepAIC в R?. В R stepAIC является одним из самых… | Ашутош Трипати | Середина"
Неделя 11 — Оптимизация и расширенные модели
Рассмотрены концепции стохастической оптимизации и других продвинутых моделей, таких как процесс естественного языка (NLP), модели выживания, повышение градиента и т. д.
- Решение проблемы сбалансированного питания на Python с использованием PuLP — Machine Learning Geek
- pulp: классы Pulp — документация PuLP v1.4.6 (coin-or.org)
Оставшиеся недели
Неделя 12–14 была анализом тематического исследования, который требовал от вас извлечения ваших знаний из всех предыдущих недель, а неделя 15 была подведением итогов курса.
Другие связанные блоги:
- Общий обзор курса и советы: ISYE 6501: Введение в аналитическое моделирование — обзор OMSCS от Технологического института Джорджии и советы
- Полезная стратегия экзамена для получения пятерки по курсу: Стратегия экзамена ISYE 6501: Введение в аналитическое моделирование — OMSCS Технологического института Джорджии
Спасибо, что прочитали эту статью. Если вам понравился мой контент, подпишитесь на меня, чтобы поддержать мою работу.