Развлечения являются частью нашей повседневной жизни, поэтому мы находим способы развлекать себя сознательно или бессознательно. Никто не любит скучать, и каждый находит то, что ему интересно, чем ему нравится заниматься.
Часто мы стараемся развлекать свою жизнь. Будь то работа, игры, фильмы, друзья, социальные сети, одна из наших конечных целей - развлекаться и оставаться в ней.
Netflix Inc. - американская компания, которая предоставляет развлечения пользователям по всему миру с помощью потокового сервиса, который предлагает множество фильмов и телесериалов.
Я пользователь Netflix, поэтому я нашел этот набор данных очень интересным, и мне очень понравилось его анализировать. Набор данных содержит список телешоу и фильмов на Netflix, он был получен от Kaggle и может быть найден здесь.
Эти данные были проанализированы с использованием различных библиотек Python, таких как numpy, pandas, seaborn, plotly и matplotlib.
Давай перейдем к делу.
ИМПОРТИРОВАТЬ НЕОБХОДИМЫЕ БИБЛИОТЕКИ.
Я начал с импорта библиотек, необходимых для анализа и, в конечном итоге, визуализации данных.
ИМПОРТ ДАННЫХ С РАБОЧЕГО СТОЛА.
Я загрузил набор данных с сайта, извлек файл из zip-файла и приступил к его импорту в записную книжку.
После этого я решил получить краткое изложение набора данных, поэтому я вызвал функцию .info (), как показано ниже.
Затем я начал сортировку данных по рейтингам, возрасту и дате. После сортировки данных я приступил к классификации фильмов по странам, после чего я классифицировал фильмы и телешоу по жанрам, как показано ниже.
Я пошел дальше, чтобы проанализировать весь набор данных, получить и визуализировать лучшие рейтинги фильмов на основе рейтинговой системы. Я использовал seaborn для построения и визуализации графика, как показано ниже.
Используя Matplotlib, я визуализировал количество зрителей в соответствии с уровнем зрелости, при этом зрелость была сгруппирована в 3 группы: взрослые, дети, подростки. Здесь я построил график зависимости количества зрителей от уровня зрелости.
С помощью Seaborn я показывал рейтинги фильмов и шоу. Я сравнил общее количество фильмов с рейтингами телевидения.
После этого я визуализировал данные для различных категорий, включая «Режиссер», «Страна», «Актеры», «Включенный в список».
Пожалуйста, ознакомьтесь с полным кодом здесь.
Из этого набора данных, анализа и визуализации я заметил, что:
Около 69,05% контента на Netflix - это фильмы, а остальные 30,95% - телешоу.
Большая часть контента была выпущена после 2010 года.
В США самое большое количество фильмов / шоу на платформе, за ними следует Индия.
Рауль Кампос и Ян Саттер являются совместными высшими директорами, за ними следуют Маркус Рэбей, Джей Кара, Кэти Гарсия, Молина и Юсеф Чачин в этом порядке.
Все ведущие актеры из Индии: Анупам Кхер появился в журнале 41 раз, за ним следуют Шахрукх, Ом Пури, Насируддин Шах и Акшай Кумар в этом порядке.
Наиболее просматриваемые категории музыки - это международные фильмы, за которыми следуют драмы, комедии, документальные фильмы, действия и приключения в указанном порядке.