Добро пожаловать в 1-й пост о визуализации данных самого популярного набора данных (PS-Hello World of Data Analytics) — наборы данных Titanic.

Обзор набора данных

Начнем с проверки данных в этих столбцах

Кратко о наборе данных

Как мы видим, 1-й столбец содержит имя путешествующих пассажиров, 2-й — пол. 3-й — самый важный столбец или наш целевой столбец, в котором рассказывается, кому всем повезло пережить аварию. В четвертой колонке указан возраст пассажиров. 6-й рассказывает о городе, в который они попали. Далее идет Pclass, который имеет класс пассажира, то есть класс A/B/C. Все остальное не так важно (подробно объясню позже), так что пока их можно пропустить.

Далее мы переходим к базовой визуализации.

Давайте объясним приведенный выше график: -
1.Синяя область показывает пассажиров, высадившихся из Саутгемптона (644).
2.Горчичный регион показывает пассажиров, прибывших из Шербура (168).
3.Зеленый регион показывает пассажиров из Квинстауна (77).
4.Красная область — пассажиры, для которых нет посадочных данных(2).

Давайте объясним приведенный выше график: -
1. По оси x указан пол (пол), по оси y показано количество пассажиров
2. Опять же, как мы видим, пол разделен на 2 отдельных столбца ( Синий и горчичный)
3. Синяя полоса показывает, скольким пассажирам не повезло выжить.
4. Горчичная полоса представляет пассажиров, выживших в авиакатастрофе.

Что мы можем сделать из графика…???

Вывод 1:- Количество выживших пассажиров-женщин намного выше, чем пассажиров-мужчин, которые могут выжить. Таким образом, мы можем сказать, что женщинам отдавался приоритет при эвакуации.

Давайте объясним приведенный выше график: -
1. По оси X отложен класс P, по оси Y показано количество пассажиров
2. Опять же, как мы видим, Pclass разделен на 2 отдельных столбца (синий и горчичный). )
3. Синяя полоса показывает, скольким пассажирам не повезло выжить.
4. Горчичная полоса представляет пассажиров, выживших в аварии.

Вывод 2:- Соотношение выживших пассажиров класса A и класса B выше, чем среди пассажиров класса C, которые могут выжить. Таким образом, можно сказать, что эвакуация была основана на классе пассажиров.

Давайте объясним приведенный выше график: -
1. Темно-синяя область показывает пассажиров из класса B (76F + 108M).
2. Горчичный регион показывает пассажиров класса A (94F + 122M).
3. Голубой регион показывает пассажиров класса C (144F + 347M).
4. Меньшая секция в регионе представляет самки этого класса.

Вывод 3:- Мы ясно видим, что женщин было меньше в каждом классе, а количество в классе C было очень высоким по сравнению с двумя другими классами. Таким образом, мы можем предположить, что на палубе находилось большое количество вспомогательного персонала и рабочих, и им был предоставлен наименьший приоритет при эвакуации.

Теперь давайте проанализируем возраст

Давайте объясним приведенный выше график: -
1. Голубая область показывает пассажиров из Шербура (168).
2. Темно-синий регион показывает пассажиров из Квинстауна (77).
3. Зеленая область показывает пассажиров из Саутгемптона (644).
4. Горчичный регион показывает пассажиров, у которых отсутствуют данные о городе (2). ).

Вывод 4:- Мы видим, что средний возраст пассажиров из Саутгемптона составляет 29,44 года, средний возраст пассажиров из Квинстауна составляет 28,04 года, а средний возраст пассажиров из Квинстауна составляет 28,04 года. возраст из Шербура 30,81. Мы видим, что сред. возраст пассажиров от каждого места не сильно различается и в среднем. возраст около 29.

Давайте объясним приведенный выше график: -
1. Голубая область показывает женщин-пассажиров (314).
2. Темно-синий регион показывает пассажиров мужского пола (577).

Вывод 5:- Мы видим, что средний возраст пассажиров женского пола составляет 27,91 года, средний возраст пассажиров-мужчин — 30,72 года.

Давайте объясним приведенный выше график:-
1.Синяя область показывает пассажиров, которые не выжили.
2. Горчичный регион показывает выживших пассажиров.
3. График имеет 2 разных стека в зависимости от пола.

Вывод 6:- Мы видим, что средний возраст выживших мужчин составляет 27,28 года, тогда как средний возраст выживших женщин составляет 28,05 лет, что интересно, поскольку предполагает, что предпочтение отдавалось женщинам среднего возраста, а предпочтение отдавалось молодым мужчинам. Кроме того, выживаемость самок довольно высока (223) по сравнению с самцами (109).

Давайте объясним приведенный выше график:-
1.Синяя область показывает пассажиров, которые не выжили.
2.Горчичный регион показывает выживших пассажиров.
3.График имеет 3 различных стека в зависимости от класса.

Вывод 7:- Мы видим, что средний возраст выживших из класса A (136) составляет 35,37 лет, средний возраст выживших из класса B (87) составляет 25,90 лет, а средний возраст выживших из класса C (119) составляет 20,65 лет, тогда как средний возраст НЕ выживших составляет 43,70 (80), 33,53 (97), 26,54 (372) для классов A, B и C соответственно. Отсюда мы можем сделать вывод, что пассажиры класса A были в основном пожилыми людьми, в классе B были люди среднего возраста, а в классе C - в основном молодые люди. Также интересно отметить, что предпочтение отдавалось более молодым людям из каждой группы.

Наконец, хотелось бы взглянуть на конечный результат анализа набора данных Titanic…

Всего в авиакатастрофе посчастливилось выжить 342 пассажирам.
Большинство из них были женщинами из класса А, и меньше всего мужчин из класса С, которые выжили.

И последнее, но не менее важное, что касается пропущенных столбцов. Мы пропустили эти столбцы, потому что в большинстве этих столбцов отсутствуют данные, которые будут рассмотрены в отдельной статье. Кроме того, такие данные, как кабина и стоимость проезда, имеют очень мало отношения к выживанию.

Спасибо за прочтение…
Ставьте лайки, делитесь и оставляйте комментарии о прочитанном.

Пожалуйста, напишите, что бы вы хотели увидеть дальше….
1. Дополнительный анализ Титаника
2. Визуализация данных любого конкретного набора данных.

Узнайте больше обо мне: - Обо мне