Люди, живущие в настоящее время в Индии, действительно сталкиваются с проблемой определения правильной арендной платы за дом в определенном месте города, и это проблема большого слона в комнате, которую большинство из нас склонны игнорировать. Чтобы пролить свет, а также дать представление о текущей ситуации на рынке недвижимости, я изо всех сил старался дать вам и всем другим читателям тенденцию или способы наблюдения за закономерностями в отношении арендной платы за дом!

Прежде чем мы углубимся, я считаю, что было бы лучше, если бы я дал вам краткий обзор набора данных, который я использовал, и другую соответствующую информацию, которая может иметь решающее значение.

Полезные сведения о наборе данных

Жилищный ландшафт в Индии демонстрирует широкий спектр: от роскошных бывших дворцов махараджей и современных высотных жилых комплексов в крупных городах до скромных хижин в отдаленных деревнях. За прошедшие годы в жилищном секторе Индии наблюдался значительный рост, в основном за счет увеличения доходов. Согласно Инициативе по измерению прав человека, Индия в настоящее время достигает 60,9% того, что считается возможным при ее нынешнем уровне дохода в отношении права на жилище.

Аренда, также называемая наймом или сдачей в аренду, включает в себя соглашение, по которому оплата производится за временное использование товара, услуги или имущества, принадлежащего другому физическому или юридическому лицу. При валовой аренде арендатор платит фиксированную сумму арендной платы, а арендодатель берет на себя ответственность за все обычные расходы на недвижимость, связанные с владением. Эта практика аренды согласуется с принципами экономики совместного потребления, которая является примером совместного использования ресурсов.

Предоставленный набор данных содержит исчерпывающую информацию о более чем 4700 объектах недвижимости, доступных для аренды, включая дома, квартиры и квартиры. Каждое свойство описывается различными параметрами, как указано в глоссарии ниже:

  1. BHK (Спальни, Зал, Кухня): Указывает количество спален, зала и кухни в каждом доме.
  2. Арендная плата: указывает сумму арендной платы за каждый дом, квартиру или квартиру.
  3. Размер: представляет размер собственности в квадратных футах.
  4. Этаж: Описывает этаж, на котором расположен объект, а также общее количество этажей в здании. Например, «Ground of 2» означает, что недвижимость находится на первом этаже двухэтажного дома.
  5. Тип площади: указывает основу, на которой рассчитывается размер собственности. Это может быть Super Area, Carpet Area или Build Area.
  6. Район Населенный пункт: Указывает населенный пункт или район, в котором находится недвижимость.
  7. Город: Обозначает город, в котором расположены дома, квартиры или квартиры.
  8. Статус меблировки: Указывает статус меблировки недвижимости, которая может быть «Меблирована», «Полумеблирована» или «Немеблирована».
  9. Предпочтительный арендатор: описывает тип арендатора, предпочитаемого владельцем или агентом недвижимости.
  10. Ванная комната: это количество ванных комнат в каждом доме.
  11. Точка контакта: указывает физическое или юридическое лицо, с которым можно связаться для получения дополнительной информации о домах, квартирах или квартирах.

Этот набор данных предоставляет исчерпывающий обзор доступной для сдачи в аренду недвижимости, что позволяет потенциальным арендаторам принимать обоснованные решения на основе их конкретных предпочтений и требований. А теперь закатываем рукава и приступаем к работе!

Я взял набор данных с веб-сайта Kaggle [Ссылка: https://www.kaggle.com/datasets/iamsouravbanerjee/house-rent-prediction-dataset]



Этот набор данных создан на указанном ниже веб-сайте. Если вы хотите узнать больше, вы можете посетить веб-сайт.



Наблюдения

Прежде чем мы перейдем к некоторым цифрам, важно, чтобы вы просмотрели данные и изучили любые возможные выводы, что я и сделал! и вот некоторые из хороших возможных интерпретаций, которые мы можем принять (начиная с категориальных столбцов, т.е. нечисловых столбцов)

Так что это категориальные столбцы, которые, по моему мнению, важны, и мы можем использовать некоторые из них для прогнозов!

Числовые столбцы

Визуализации

Существуют различные способы, которыми мы могли бы искать и исследовать закономерности. На мой взгляд, некоторых приведенных ниже диаграмм более чем достаточно, чтобы дать вам хорошее представление о том, что данные пытаются нам сказать.

Преобразование категориальных чисел в числовые

Я использовал преобразователь столбца, чтобы преобразовать категориальные столбцы в числовые значения.

Вот полученная корреляция данных друг с другом:

Я выполнил гораздо больше визуализаций, которые вы можете изучить самостоятельно (Github).

Тренировочные модели

Я использовал пакет pycaret для обучения на разных моделях, а затем сравниваю их друг с другом и получаю лучшую модель для поставленной задачи.

Вот краткое изложение обучения различных моделей с использованием pycaret:

Окончательный прогноз

Проект загружен и общедоступен для использования, вот ссылка:



Возможности повышения точности:

  1. Использование различных методов регуляризации, таких как Ridge/Lasso
  2. Может стандартизировать или нормализовать числовые значения.
  3. Удалите выбросы, чтобы повысить точность
  4. Используйте методы ансамбля (такие как бэггинг, вставка, усиление, случайные леса и т. д.)

Если вам нравится то, что я делаю, подарите мне немного любви и поддержки! (Я новичок в этом!)

Мой собственный веб-сайт:



Другие социальные платформы, которыми я сейчас пользуюсь:

Линкедин, Инстаграм