Cyclistic Bike Share — это завершающий проект для завершения курса Google Data Analyst Certificate. Он имитирует задачи младшего аналитика данных, работающего в маркетинговой команде Cyclistic, вымышленной компании по прокату велосипедов в Чикаго.
Цели
Основная цель этого анализа — продемонстрировать навыки, полученные в ходе курса, и применить их в практической ситуации. Cyclistic хочет понять, как случайные гонщики и ежегодные участники по-разному используют общие велосипеды, и на основе информации, полученной в результате этого исследования, маркетинговая команда разработает стратегии по превращению случайных гонщиков в ежегодных участников. Таким образом, помимо понимания того, как клиенты используют продукты, анализ направлен на предоставление информации для принятия более эффективных решений для компании в будущем.
Подготовка
Используемые данные были загружены по ссылке, предоставленной Google для этого конкретного анализа. Данные содержат актуальную информацию об использовании велосипедов участниками и случайными водителями и разделены на несколько файлов .CSV. У данных было несколько проблем с отслеживанием, нереалистичные выбросы продолжительности поездок, много NA. Я решил отфильтровать данные и использовать в своем анализе только поездки с января 2021 года по сентябрь 2021 года.
Очистка данных
Я решил использовать только поездки продолжительностью от 2 минут до 2 часов и отфильтровал их с помощью Excel. Я использовал библиотеку readxl для загрузки файлов .CSV в R Studio, как показано ниже:
Следующим шагом было объединение фреймов данных в один фрейм данных, и для этого я использовал функцию bind_rows из Dplyr следующим образом:
После процессов очистки и привязки мне удалось получить некоторые данные о данных:
Всего поездок: 4 161 939
Месяцы: с января 2021 г. по сентябрь 2021 г.
Типы велосипедов:электрический велосипед, велосипед с прицепом и классический велосипед.
2 группы клиентов: участники и случайные пользователи
Затем я начал создавать графики с помощью ggplot2, чтобы лучше визуализировать данные и собирать информацию. Для начала давайте посмотрим, как количество поездок меняется месяц за месяцем:
Ключевые выводы:
Количество поездок увеличивается весной и достигает пика летом.
Летние аттракционы составляют более 50% от общего числа поездок за этот период.
Зимние месяцы - это месяцы с наименьшим количеством поездок, вероятно, из-за холодной погоды.
Так что насчет месяца? Давайте посмотрим, есть ли какие-либо существенные изменения или предпочтительные дни для поездок в течение месяца:
Ключевые выводы:
Количество поездок очень стабильно в течение месяцев
В анализируемых месяцах нет предпочтительного дня для поездок
Дни с большим количеством поездок составляют примерно 3% от общего числа поездок в течение месяца.
При просмотре выходных и будних дней я смог найти отличия:
Основные выводы:
Количество поездок выше в выходные дни (пятница, суббота и воскресенье).
Случайные гонщики - основные факторы, вызвавшие эту разницу в поездках.
Так что, если случайные гонщики увеличивают количество поездок по выходным, может быть, случайных гонщиков больше, чем постоянных участников. Но оказывается, что нет, случайные гонщики несут ответственность за 48% всех поездок на велосипеде в этой компании.
Ключевые выводы:
Ежегодные участники соответствуют 52% от общей базы данных поездок.
Случайные участники соответствуют 48% от общей базы данных поездок.
Давайте внимательнее посмотрим, проявляют ли участники, случайные и годовые участники, какие-либо предпочтения в отношении типов велосипедов:
Ключевые выводы:
Обе группы предпочитают так называемый «классический велосипед».
Наименее предпочтительным типом велосипеда является «пристыкованный велосипед».
Случайные гонщики и ежегодные участники демонстрируют схожие предпочтения в отношении типов велосипедов.
Сочетая две группы, как и ожидалось, классический велосипед является предпочтительным типом велосипеда:
Ключевые выводы:
Классический велосипед является предпочтительным типом велосипеда для поездок.
Eletric Bike — второй по посещаемости тип велосипеда.
Пристыкованный велосипед — наименее предпочтительный тип велосипеда для покупателей.
Итак, давайте посмотрим на структуру использования между группами по месяцам:
Ключевые выводы:
Модель использования аналогична между группами
Летом обычные гонщики используют больше, что приводит к резкому увеличению общего количества поездок.
В заключение я проанализировал шаблон использования. Я сравнил ежегодных участников и случайных гонщиков по дням недели, и вот как выглядит использование:
Ключевые выводы:
Случайные гонщики чаще используют велосипеды по выходным, вероятно, в развлекательных целях.
Ежегодные участники чаще используют велосипеды в будние дни, возможно, для поездок на работу.
Основные рекомендации для компании
В рамках проекта capstone я создал рекомендации для компании на основе проанализированных данных. На мой взгляд, компания должна сделать следующее, чтобы повысить конверсию случайных участников в годовых:
Повысьте пробные программы для случайных гонщиков, чтобы стать участниками
Увеличить количество действий, направленных на улучшение использования членами клуба в выходные дни и на улучшение условий для случайных водителей в рабочие дни.
Программы по продвижению поездок на работу на велосипедных велосипедах.
Поощряйте постоянных пользователей с помощью программ лояльности
Оцените основные причины снижения использования велосипедов зимой.
Используйте видеоконтент, чтобы повысить осведомленность о программе членства и ее преимуществах.
Розыгрыши для повышения коэффициента конверсии случайных гонщиков
Реферальные программы для увеличения числа ежегодных участников
Участники могут участвовать, рекомендуя, и иметь месяцы отдыха
Обзор проекта
На мой взгляд, это был интересный проект. Курс дает хорошее представление об анализе данных, особенно когда речь идет о программировании на R, в котором у меня раньше не было опыта и которое я больше всего использовал для этого задания. Проект пытается хорошо смоделировать задачи младшего аналитика, и предоставленные данные могут привести к очень интересным выводам. У моего анализа есть некоторые ограничения, но я смог многому у него научиться, и я с нетерпением жду возможности развить свои навыки и поделиться с вами новыми анализами.