Люди, живущие в настоящее время в Индии, действительно сталкиваются с проблемой определения правильной арендной платы за дом в определенном месте города, и это проблема большого слона в комнате, которую большинство из нас склонны игнорировать. Чтобы пролить свет, а также дать представление о текущей ситуации на рынке недвижимости, я изо всех сил старался дать вам и всем другим читателям тенденцию или способы наблюдения за закономерностями в отношении арендной платы за дом!
Прежде чем мы углубимся, я считаю, что было бы лучше, если бы я дал вам краткий обзор набора данных, который я использовал, и другую соответствующую информацию, которая может иметь решающее значение.
Полезные сведения о наборе данных
Жилищный ландшафт в Индии демонстрирует широкий спектр: от роскошных бывших дворцов махараджей и современных высотных жилых комплексов в крупных городах до скромных хижин в отдаленных деревнях. За прошедшие годы в жилищном секторе Индии наблюдался значительный рост, в основном за счет увеличения доходов. Согласно Инициативе по измерению прав человека, Индия в настоящее время достигает 60,9% того, что считается возможным при ее нынешнем уровне дохода в отношении права на жилище.
Аренда, также называемая наймом или сдачей в аренду, включает в себя соглашение, по которому оплата производится за временное использование товара, услуги или имущества, принадлежащего другому физическому или юридическому лицу. При валовой аренде арендатор платит фиксированную сумму арендной платы, а арендодатель берет на себя ответственность за все обычные расходы на недвижимость, связанные с владением. Эта практика аренды согласуется с принципами экономики совместного потребления, которая является примером совместного использования ресурсов.
Предоставленный набор данных содержит исчерпывающую информацию о более чем 4700 объектах недвижимости, доступных для аренды, включая дома, квартиры и квартиры. Каждое свойство описывается различными параметрами, как указано в глоссарии ниже:
- BHK (Спальни, Зал, Кухня): Указывает количество спален, зала и кухни в каждом доме.
- Арендная плата: указывает сумму арендной платы за каждый дом, квартиру или квартиру.
- Размер: представляет размер собственности в квадратных футах.
- Этаж: Описывает этаж, на котором расположен объект, а также общее количество этажей в здании. Например, «Ground of 2» означает, что недвижимость находится на первом этаже двухэтажного дома.
- Тип площади: указывает основу, на которой рассчитывается размер собственности. Это может быть Super Area, Carpet Area или Build Area.
- Район Населенный пункт: Указывает населенный пункт или район, в котором находится недвижимость.
- Город: Обозначает город, в котором расположены дома, квартиры или квартиры.
- Статус меблировки: Указывает статус меблировки недвижимости, которая может быть «Меблирована», «Полумеблирована» или «Немеблирована».
- Предпочтительный арендатор: описывает тип арендатора, предпочитаемого владельцем или агентом недвижимости.
- Ванная комната: это количество ванных комнат в каждом доме.
- Точка контакта: указывает физическое или юридическое лицо, с которым можно связаться для получения дополнительной информации о домах, квартирах или квартирах.
Этот набор данных предоставляет исчерпывающий обзор доступной для сдачи в аренду недвижимости, что позволяет потенциальным арендаторам принимать обоснованные решения на основе их конкретных предпочтений и требований. А теперь закатываем рукава и приступаем к работе!
Я взял набор данных с веб-сайта Kaggle [Ссылка: https://www.kaggle.com/datasets/iamsouravbanerjee/house-rent-prediction-dataset]
Этот набор данных создан на указанном ниже веб-сайте. Если вы хотите узнать больше, вы можете посетить веб-сайт.
Наблюдения
Прежде чем мы перейдем к некоторым цифрам, важно, чтобы вы просмотрели данные и изучили любые возможные выводы, что я и сделал! и вот некоторые из хороших возможных интерпретаций, которые мы можем принять (начиная с категориальных столбцов, т.е. нечисловых столбцов)
Так что это категориальные столбцы, которые, по моему мнению, важны, и мы можем использовать некоторые из них для прогнозов!
Числовые столбцы
Визуализации
Существуют различные способы, которыми мы могли бы искать и исследовать закономерности. На мой взгляд, некоторых приведенных ниже диаграмм более чем достаточно, чтобы дать вам хорошее представление о том, что данные пытаются нам сказать.
Преобразование категориальных чисел в числовые
Я использовал преобразователь столбца, чтобы преобразовать категориальные столбцы в числовые значения.
Вот полученная корреляция данных друг с другом:
Я выполнил гораздо больше визуализаций, которые вы можете изучить самостоятельно (Github).
Тренировочные модели
Я использовал пакет pycaret для обучения на разных моделях, а затем сравниваю их друг с другом и получаю лучшую модель для поставленной задачи.
Вот краткое изложение обучения различных моделей с использованием pycaret:
Окончательный прогноз
Проект загружен и общедоступен для использования, вот ссылка:
Возможности повышения точности:
- Использование различных методов регуляризации, таких как Ridge/Lasso
- Может стандартизировать или нормализовать числовые значения.
- Удалите выбросы, чтобы повысить точность
- Используйте методы ансамбля (такие как бэггинг, вставка, усиление, случайные леса и т. д.)
Если вам нравится то, что я делаю, подарите мне немного любви и поддержки! (Я новичок в этом!)