С чего начать, если вы не знаете, с чего начать, с упором на аналитику людей

Обзор

Я видел, как большинство людей добиваются успеха в изучении R — это заложить основы языка программирования (см. Шаг 2), а затем напрямую применить их к чему-то, что их волнует или что в любом случае нужно сделать. Когда я только начал Я начинал проект на R и продвигался как можно дальше в R, а затем записывал места, где я застрял, чтобы иметь возможность вернуться позже и разобраться в этом, пока завершаю проект в SPSS, Excel и т. д. , чтобы уложиться в срок. Я посещал R-Bloggers каждый день, чтобы почувствовать искусство возможного, а затем посмотреть, что я могу оттуда извлечь и применить к People Analytics. Теперь, когда ChatGPT и другие диалоговые чат-боты появились в сети, у вас появился еще один помощник, и я призываю вас использовать одного из этих чат-ботов в качестве второго пилота в вашем путешествии по программированию.

Шаг 0 — графические интерфейсы для R

Если вы не совсем готовы к использованию скриптового языка программирования, то Jamovi может стать для вас отправной точкой. Это графический интерфейс для R (похожий на SPSS), как вы можете видеть в руководстве пользователя.

Шаг 0.5 — Переход из Excel

Если вы знакомы с Excel, эта статья представляет собой удобный переход на R.

Как перейти с Excel на R

Шаг 1 — Приобретите R and R Studio!

Сначала убедитесь, что у вас есть R и R Studio. Ссылка для скачивания интегрированной среды разработки (IDE) RStudio находится здесь.

Шаг 2 — Вводный видеоурок

После того, как вы установили R and R Studio, я нашел на Youtube следующее руководство с сайта freeCodeCamp.org, представленное Бартоном Поулсоном, которое оказалось очень полезным. Он затронет следующие направления:

  • Установка Р
  • RStudio
  • Пакеты
  • сюжет()
  • Гистограммы
  • Гистограммы
  • Диаграммы рассеяния
  • Наложение графиков
  • краткое содержание()
  • описывать()
  • Выбор случаев
  • Форматы данных
  • Факторы
  • Ввод данных
  • Импорт данных
  • Иерархическая кластеризация
  • Основные компоненты
  • Регрессия
  • Следующие шаги

Если вам тоже понравилось, не забудьте поставить лайк, оставить комментарий и подписаться!

Как только вы почувствуете себя более комфортно с R, Posit (формально RStudio) создаст большой репозиторий шпаргалок, которые они создают для различных пакетов R, здесь.

Если вы лучше учитесь по видео и на структурированных занятиях:

Шаг 3a — Учебный курс по науке о данных и машинному обучению с R

Udemy — Учебный курс по науке о данных и машинному обучению с R — Хосе Портилья Обычно он продается менее чем за 15 долларов. Все от Хосе Портильи великолепно! Вы также можете начать здесь с бесплатного раздела Введение в R на Udemy.

Если вы лучше учитесь, следуя книге, и любите прыгать:

Шаг 3b — Практическое программирование с помощью R

Практическое программирование на R — бесплатная и полезная книга. Введение в R — Эндрю Эллис и Борис Майер. Это проведет вас от установки R до CFA, SEM и HLM.

Если вы лучше учитесь по слайдам и вам нравится структура «Начинающий», «Средний» и «Продвинутый»:

Шаг 3в — Мастер-классы Брэда Бёмке

Введение в Р

Средний R

Продвинутый Р

Брэд Бёмке проделывает феноменальную работу, проводя вас через процесс начала работы с R вплоть до более продвинутых методов, используя занимательные и интерактивные слайды, а также предоставляя вам сценарии и файлы.

Шаг 3d — курс Ричарда Лэндерса «Наука о данных для социологов»

Наука о данных для социологов Расписание и материалы

Мне нравится этот Доктор. Ричард Ландерс охватывает манипуляции со строками и обработку естественного языка (НЛП), включая регулярные выражения (REGEX) в курсе RegexOne, поскольку это очень ценно для социологов, поскольку мы часто сталкиваемся с качественными данными, а НЛП и REGEX позволяют нам извлечь необходимую информацию за минимальное количество времени.

Если вы уже чувствуете себя комфортно с R, перейдите к шагу 4, а затем перейдите к разделу DPLYR:

Шаг 4 — Обработка данных

Подробное руководство по использованию dplyr из tidyverse для обработки ваших данных. Обработка данных с помощью dplyr (4 части)

Сьюзан Баерт знакомит вас с основными аспектами tidyverse, чтобы помочь вам подчинить данные своей воле.

Шаг 4а — Даты и время!

Даты и время могут стать камнем преткновения при работе с данными. lubridate из tidyverse значительно упрощает преобразование данных в правильный формат.

Смазка Данные даты и времени со смазкой

Шаг 5 — Справочник по программному обеспечению R

R Software Handbook бесплатен и включает в себя следующее:

  1. Основы R
  2. Подготовка и очистка данных
  • Манипуляция данными
  • Статистика
  1. Данные, а именно в базе R
  2. Данные отображаются с ggplot2

Шаг 6 — Большая книга R

Большая книга R от Оскара Баруффа — содержит все необходимое (более 300 книг и продолжает расти) и постоянно обновляется. Ниже я расскажу о некоторых остановках, если вы не знаете, с чего начать:

  1. «2 Впервые в R? Начало здесь"
  2. 22.20 Поваренная книга Tidyverse
  3. 12.1 Учебное пособие по ggplot2 для красивой графики в R
  4. 14.10 Справочник по регрессионному моделированию в HR-аналитике
  5. 14.9 Справочник по графикам и сетям в HR-аналитике с примерами на R и Python
  6. 14,15 Р для пользователей Excel
  7. 17.4 Анализ текста с помощью R
  8. 20.14 Аккуратное моделирование с помощью R
  9. 20.5 Практические занятия по машинному обучению с помощью R

Шаг 7. Если вы выполнили вышеуказанные шаги, теперь вы будете знать, куда вам нужно идти, чтобы продолжить свое путешествие по R. Ниже я дал несколько советов, если вы такой же ученый-социолог, как и я.

Наука о данных для психологов — еще одна бесплатная книга R для HR Компьютеры для информатики — здесь есть всего понемногу 7 наборов HR-данных для HR-аналитики

Если вам не нужно видео, начните здесь с Coding Club и проработайте слайды Введение в R.

Тогда отправляйтесь в Jumpstart with R, созданный потрясающим Мэттом Данчо. Это платное занятие, но, на мой взгляд, оно того стоит.

Чтобы увидеть, как профессионалы используют R, вот пошаговые руководства Дэвида Робинсона TidyTuesday на YouTube, где он каждую неделю обсуждает и визуализирует разные наборы данных, используя R.

Джули Силге, специалист по данным и инженер-программист в Postit PBC, также отлично справляется с данными TidyTuesday и часто использует машинное обучение.

Выделенные блоги Юлии Силге:

Также есть этот курс в программе UC Business Analytics, использующий DataCamp.

Шаг 8 — Объектно-ориентированное программирование (ООП)

Объектно-ориентированное программирование (ООП) — это способ организации и разработки компьютерных программ, делающий их более управляемыми и простыми для понимания. Это похоже на размышления об окружающем нас мире, где все является объектом с определенными характеристиками и поведением.

Объектно-ориентированное программирование (ООП) в R | Создание объектов и классов RПродвинутый уровень R — введение в ООП

Шаг 9 — Анализ временных рядов

В этой серии Борис Гуаризма знакомит вас с различными способами рассмотрения данных временных рядов. https://blog.bguarisma.com/series/time-series-forecasting

Шаг 10. Теперь у вас должно быть четкое представление о том, куда вам нужно идти дальше. Вот еще несколько полезных сайтов, которые я нашел

ДПЛИР

Как только вы доберетесь до раздела dplyr вышеуказанных классов, вы можете добавить их.

А пока посетите эти сайты, чтобы узнать, как на самом деле можно использовать R для презентаций для непрофессионалов (руководителей, руководителей, менеджеров и т. д.).

Tabyls — аккуратный, полнофункциональный подход к подсчету вещей Openxlsx — упрощает создание файлов Excel с помощью R Spin — превращает R-скрипты в HTML, PDF, Word (производное от Knitr и Rmarkdown) formattable-pretty таблицы в R Officer документы PowerPoint и Word прямо из R

Бонусы за HR-аналитику

R for People Analytics — RStudio Conference 2022 — Кейт МакНалти]

Рассказ о данных

Рассказывание историй с помощью данных — с приложениями на R — Рохан Александр (2023 г.)

Написание функций в Tidyverse

R для эпидемиологии — Функции записи

Бонусы за машинное обучение

Введение в машинное обучение с помощью Tidyverse — это доклад Элисон Хилл из rstudio::conf. Нажмите Начать здесь, чтобы увидеть все слайды и код.

Блог Джулии Силге — множество данных TidyTuesday предварительно обрабатываются и моделируются с помощью TidyModels.

Машинное обучение с {tidymodels} — обучайте несколько моделей одновременно

Объяснимость моделей {tidymodels} с помощью {iml}

Мои заметки по науке о данных — заметки Майкла Фоули по различным занятиям по науке о данных в книжном формате.

Введение в прикладное машинное обучение — Джон Дж. Кертин — Этот курс предназначен для того, чтобы познакомить студентов с различными вычислительными подходами в машинном обучении. Курс разработан с учетом двух ключевых направлений. Во-первых, студенты сосредоточатся на применении распространенных, нестандартных статистических алгоритмов обучения, которые имеют хорошую производительность и реализованы в аккуратных моделях на R. Во-вторых, студенты сосредоточатся на применении этих подходов в контексте общие вопросы поведенческой науки в научных кругах и промышленности.

ISLR Tidymodels Labs — лабораторные работы из раздела Введение в статистическое обучение с приложениями на R с использованием tidymodels

Использование машинного обучения в производстве

Машинное обучение для социологов — Хорхе Симентада

Какое место занимает вероятность? — виньетка для функции threshold_perf для определения оптимального порогового порога классификации с помощью tidymodels

Решения от Posit — Начало работы

Другие полезные сайты, посвященные статистике

StatQuest — Джош Стармер

Статистика судьбы — доктор Эрин Бьюкенен

Квантовая психология — доктор Дастин Файф

Если вам понравилась эта статья, вы можете помочь мне поделиться этими знаниями с другими: 👏хлопайте в ладоши, 💬комментируйте и обязательно 👤+ подписывайтесь.