Cyclistic Bike Share — это завершающий проект для завершения курса Google Data Analyst Certificate. Он имитирует задачи младшего аналитика данных, работающего в маркетинговой команде Cyclistic, вымышленной компании по прокату велосипедов в Чикаго.

Цели

Основная цель этого анализа — продемонстрировать навыки, полученные в ходе курса, и применить их в практической ситуации. Cyclistic хочет понять, как случайные гонщики и ежегодные участники по-разному используют общие велосипеды, и на основе информации, полученной в результате этого исследования, маркетинговая команда разработает стратегии по превращению случайных гонщиков в ежегодных участников. Таким образом, помимо понимания того, как клиенты используют продукты, анализ направлен на предоставление информации для принятия более эффективных решений для компании в будущем.

Подготовка

Используемые данные были загружены по ссылке, предоставленной Google для этого конкретного анализа. Данные содержат актуальную информацию об использовании велосипедов участниками и случайными водителями и разделены на несколько файлов .CSV. У данных было несколько проблем с отслеживанием, нереалистичные выбросы продолжительности поездок, много NA. Я решил отфильтровать данные и использовать в своем анализе только поездки с января 2021 года по сентябрь 2021 года.

Очистка данных

Я решил использовать только поездки продолжительностью от 2 минут до 2 часов и отфильтровал их с помощью Excel. Я использовал библиотеку readxl для загрузки файлов .CSV в R Studio, как показано ниже:

Следующим шагом было объединение фреймов данных в один фрейм данных, и для этого я использовал функцию bind_rows из Dplyr следующим образом:

После процессов очистки и привязки мне удалось получить некоторые данные о данных:

Всего поездок: 4 161 939

Месяцы: с января 2021 г. по сентябрь 2021 г.

Типы велосипедов:электрический велосипед, велосипед с прицепом и классический велосипед.

2 группы клиентов: участники и случайные пользователи

Затем я начал создавать графики с помощью ggplot2, чтобы лучше визуализировать данные и собирать информацию. Для начала давайте посмотрим, как количество поездок меняется месяц за месяцем:

Ключевые выводы:

Количество поездок увеличивается весной и достигает пика летом.

Летние аттракционы составляют более 50% от общего числа поездок за этот период.

Зимние месяцы - это месяцы с наименьшим количеством поездок, вероятно, из-за холодной погоды.

Так что насчет месяца? Давайте посмотрим, есть ли какие-либо существенные изменения или предпочтительные дни для поездок в течение месяца:

Ключевые выводы:

Количество поездок очень стабильно в течение месяцев

В анализируемых месяцах нет предпочтительного дня для поездок

Дни с большим количеством поездок составляют примерно 3% от общего числа поездок в течение месяца.

При просмотре выходных и будних дней я смог найти отличия:

Основные выводы:

Количество поездок выше в выходные дни (пятница, суббота и воскресенье).

Случайные гонщики - основные факторы, вызвавшие эту разницу в поездках.

Так что, если случайные гонщики увеличивают количество поездок по выходным, может быть, случайных гонщиков больше, чем постоянных участников. Но оказывается, что нет, случайные гонщики несут ответственность за 48% всех поездок на велосипеде в этой компании.

Ключевые выводы:

Ежегодные участники соответствуют 52% от общей базы данных поездок.

Случайные участники соответствуют 48% от общей базы данных поездок.

Давайте внимательнее посмотрим, проявляют ли участники, случайные и годовые участники, какие-либо предпочтения в отношении типов велосипедов:

Ключевые выводы:

Обе группы предпочитают так называемый «классический велосипед».

Наименее предпочтительным типом велосипеда является «пристыкованный велосипед».

Случайные гонщики и ежегодные участники демонстрируют схожие предпочтения в отношении типов велосипедов.

Сочетая две группы, как и ожидалось, классический велосипед является предпочтительным типом велосипеда:

Ключевые выводы:

Классический велосипед является предпочтительным типом велосипеда для поездок.

Eletric Bike — второй по посещаемости тип велосипеда.

Пристыкованный велосипед — наименее предпочтительный тип велосипеда для покупателей.

Итак, давайте посмотрим на структуру использования между группами по месяцам:

Ключевые выводы:

Модель использования аналогична между группами

Летом обычные гонщики используют больше, что приводит к резкому увеличению общего количества поездок.

В заключение я проанализировал шаблон использования. Я сравнил ежегодных участников и случайных гонщиков по дням недели, и вот как выглядит использование:

Ключевые выводы:

Случайные гонщики чаще используют велосипеды по выходным, вероятно, в развлекательных целях.

Ежегодные участники чаще используют велосипеды в будние дни, возможно, для поездок на работу.

Основные рекомендации для компании

В рамках проекта capstone я создал рекомендации для компании на основе проанализированных данных. На мой взгляд, компания должна сделать следующее, чтобы повысить конверсию случайных участников в годовых:

Повысьте пробные программы для случайных гонщиков, чтобы стать участниками

Увеличить количество действий, направленных на улучшение использования членами клуба в выходные дни и на улучшение условий для случайных водителей в рабочие дни.
Программы по продвижению поездок на работу на велосипедных велосипедах.

Поощряйте постоянных пользователей с помощью программ лояльности

Оцените основные причины снижения использования велосипедов зимой.

Используйте видеоконтент, чтобы повысить осведомленность о программе членства и ее преимуществах.

Розыгрыши для повышения коэффициента конверсии случайных гонщиков

Реферальные программы для увеличения числа ежегодных участников

Участники могут участвовать, рекомендуя, и иметь месяцы отдыха

Обзор проекта

На мой взгляд, это был интересный проект. Курс дает хорошее представление об анализе данных, особенно когда речь идет о программировании на R, в котором у меня раньше не было опыта и которое я больше всего использовал для этого задания. Проект пытается хорошо смоделировать задачи младшего аналитика, и предоставленные данные могут привести к очень интересным выводам. У моего анализа есть некоторые ограничения, но я смог многому у него научиться, и я с нетерпением жду возможности развить свои навыки и поделиться с вами новыми анализами.