Анализ поступления в высшие учебные заведения США

Люди часто говорят: «Вы можете найти обладателей степени бакалавра почти везде». Хотя это может быть преувеличением, действительно существует растущая тенденция показывать, что студенты продвигаются дальше по пути, вместо того, чтобы довольствоваться своим нынешним уровнем бакалавриата.

Статистика показывает, что существует значительная тенденция роста числа магистров. Согласно Duffin (2020), в 2022–2023 учебном году ожидается, что 493 000 студентов женского пола и 330 000 студентов мужского пола получат степень магистра в Соединенных Штатах. Эти цифры значительно увеличились по сравнению с 1970-ми годами.

Вы можете подумать: «К чему вся эта шумиха? Разве вам не достаточно утомительно выполнять все эссе и задания?» Конечно, никто не любит рутинную работу, что делает их настолько одержимыми магистерскими степенями, так это престиж и продвижение по карьерной лестнице, которые дают право на получение степени магистра. это.

Согласно статистике Нью-Йоркского университета, американские работники со степенью магистра или выше получают среднюю годовую зарплату в размере 55 242 долларов США, по сравнению с теми, кто имеет степень бакалавра, чья средняя годовая зарплата составляет 42 877 долларов США, согласно Бюро переписи населения США. Это представляет почти 30-процентную разницу в средней годовой зарплате и дает четкое доказательство того, что получение степени магистра может оказать положительное влияние на финансовое положение.

В то время как некоторые могут захотеть изучить увлеченную область и изучить будущую работу в смежной области; добиться признания и авторитета; приобрести навыки в новых технологиях и методах, которые разработаны в их областях.

Постановка задачи

В связи с этим мой проект по науке о данных направлен на то, чтобы выяснить:

  1. Что способствует успешному поступлению в магистратуру в Штатах
  2. Каково общее распределение академической силы абитуриентов
  3. Насколько вероятно, что академической оценки будет достаточно, чтобы поступить в магистратуру

Ограничение

Поскольку это небольшой набор данных (400 строк x 9 столбцов), существуют некоторые потенциальные ограничения для тех, кто хочет серьезно относиться к этому набору данных.

Визуализация

В то время как все академические переменные довольно сильно коррелируют друг с другом, CGPA, похоже, больше всего коррелирует с шансами на поступление.

Заключение

Проще говоря, чем выше ваши академические баллы, тем больше у вас шансов получить степень магистра. Тем не менее, диаграммы, кажется, говорят нам, что CGPA важнее, чем просто престиж вуза.

Прогнозное моделирование

В этом проекте я решил использовать линейную регрессию, которая часто используется в качестве прогностической модели для выражения непрерывного количественного значения. В частности, это помогает моделировать линейные отношения.

Это статистический метод, который включает в себя несколько переменных характеристик (CGPA и т. д.) для прогнозирования результата переменной ответа (вероятность допуска).

Судя по двумерным графикам и изображениям, большинство распределений демонстрируют восходящий вертикальный тренд. Вот почему линейная регрессия является наиболее предпочтительной.

В конце концов, просто применив линейную регрессию, я успешно набрал 82% тестов R2, что является полезным и плодотворным. В конце концов, мы, конечно же, не хотим подгонять наши данные и делать их устаревшими для новых невидимых данных. Эта оценка для меня довольно хороша и достаточно универсальна, чтобы обслуживать больше неизвестных данных.

Если вы хотите расширить использование прогностической модели, я настоятельно рекомендую Streamlit. Это обеспечивает быстрое и эффективное развертывание кода.

Хотя панель пока выглядит схематично, но как мой первый проект по науке о данных, это, безусловно, важная веха для меня, чтобы продолжать искать больше знаний в этом бесконечном путешествии. Всем привет.