Аналитика данных Google :: Проект Capstone. ……….Велосипедист

ЭКЕНЕ ОХАНУСИ .Б

Как младший аналитик данных, который в настоящее время находится на рынке труда в поисках прекрасных возможностей для развития своей карьеры и навыков, я решил поработать над этим набором данных о велосипедистах и ​​воспользовался принципом «спрашивайте, готовьте, обрабатывайте, анализируйте, делитесь и действуйте». подход к выполнению задачи. Ладно, приступим к делу

Вопросы заинтересованных сторон.

  1. Как ежегодные участники и случайные гонщики по-разному используют велосипедные велосипеды?
  2. 2. Зачем случайным гонщикам покупать годовое членство в Cyclistic?
  3. 3. Как Cyclistic может использовать цифровые медиа, чтобы убедить случайных гонщиков стать членами?

Инструменты, использованные в этом проекте.

Электронная таблица Excel

Майкрософт sql (ssms)

Сила Би

Сначала мне пришлось скачать

"Здесь"

Я использовал с 2020–04 по 2021–03.

Затем я загрузил данные на лист Excel, состоящий из 12 листов. Чтобы иметь представление о данных.

После этого я создал базу данных на Microsoft sql (ssms) и загрузил лист excel. После этого мне пришлось объединить 12 таблиц, чтобы сделать их одной, но я столкнулся с небольшой проблемой: тип данных 12 таблиц имел некоторое несоответствие, и было невозможно просто объединить таблицу таким образом. Поэтому мне пришлось настроить столбцы в разных таблицах, чтобы все они были одинаковыми.

Затем мне нужно было, чтобы набор данных был в его простейшей форме, поэтому я начал расширять некоторые столбцы, извлекая больше столбцов из содержащихся в нем данных.

Я делал это до тех пор, пока у меня не было всех необходимых столбцов для ответов на вопросы стейкхолдеров.

Поэтому после этого мне пришлось экспортировать данные из ssms в power bi для визуализации.

Это были мои выводы из анализа этого набора данных, поскольку он связан с ответами на вопросы, заданные заинтересованными сторонами.

  1. Какие различия между годовыми участниками и случайными гонщиками в использовании велосипедных велосипедов?

Общее распределение пользователей состоит из общего количества уникальных ride_id как участников, так и причинных пользователей.

Это общее время использования участников и причинных пользователей. Это в минутах

Это распределение состоит из расстояния, пройденного как членами, так и каузальными пользователями, в милях.

Эта диаграмма показывает предпочтительный тип езды как участниками, так и причинными пользователями.

На этой диаграмме показано количество поездок, совершенных за каждый квартал как участниками, так и случайными пользователями.

Эта диаграмма показывает будние действия как участников, так и причинных пользователей.

И эта диаграмма показывает действия как участников, так и случайных пользователей в разное время дня.

Ежемесячная активность как участников, так и случайных пользователей, основанная на количестве поездок в месяц.

2. Зачем случайным гонщикам покупать годовое членство в Cyclistic?

  • Когда действует скидка для новых участников.
  • Когда есть хорошая разница в стоимости между участниками и случайными пользователями.

3. Как Cyclistic может использовать цифровые медиа, чтобы убедить случайных гонщиков стать членами?

Исходя из различной информации из проанализированного набора данных, для оптимизации охвата кампаний в цифровых СМИ ключевым фактором будет правильное время.

Давайте посмотрим на график ниже

Мы видим, что больше поездок запускается с 8:00 до 19:00 с пиковой активностью в 18:00, поэтому разработка кампании для запуска в этот период дня действительно приведет к большему охвату.

Взглянув на ежеквартальную активность, вы увидите, что активность выше в течение третьего квартала, поэтому для большего охвата воздействие кампании на причинных пользователей в течение 3-го квартала приведет к большему охвату. Особенно, когда СМИ размещаются на райд-станциях.

Затем мы можем более подробно изучить деятельность в будние дни, чтобы узнать, что в выходные дни они представляют собой большое количество активных случайных пользователей.

Таким образом, исходя из информации о том, можно с уверенностью сказать, что для большего охвата аудитории хорошая кампания будет обладать этими атрибутами.

  1. Быть с 8:00 до 19:00
  2. В выходные будет активнее
  3. И должен быть намного активнее в течение 3-го квартала года.