Давайте применим научный подход к модели предсказания дома!

С чего начать предсказание дома?

Прежде чем мы начнем, давайте посмотрим, что делают другие.

Самая большая проблема, которая возникает, — управлять ценами на недвижимость или прогнозировать их на определенный период. Таким образом, заинтересованные стороны, покупатели и застройщики хотели бы знать, какие атрибуты влияют на цену дома. Давайте посмотрим, как мы подойдем к проблеме…

вступление

Согласно сопутствующим исследованиям, рынок недвижимости влияет на национальную экономику. Поскольку реальное состояние играет важную роль, необходимо отсортировать все эти исторические данные с помощью некоторых аналитических инструментов. Процесс оценки Дома можно разделить на два метода:

  • традиционная оценка,
  • предварительная оценка.

Традиционный подход связан с регрессионными моделями или гедонистическими инструментами, в то время как более продвинутые инженеры используют расширенную оценку, такую ​​как системы пространственного анализа или искусственные нейронные сети. Другой стандартной моделью прогнозирования цен на жилье является Регрессия опорных векторов (SVR).

Гедонистическая модель

По определению, гедонистическая модель ценообразования — это статистическая модель, которая считает, что стоимость имущества представляет собой сумму всех его атрибутов, основанную на теории гедонистического рынка. Первая зарегистрированная гедонистическая модель появилась еще в 1939 году, исследование экономиста Эндрю Корта работало в General Motors. Модель использовалась для анализа стоимости автомобилей по ценовым и качественным характеристикам.

Согласно исследованию Джафари, гедонистическая модель определяет ключевые характеристики, определяющие цены, которые в США определяются площадью квартиры, за которой следует местоположение. Таким образом, он объяснил, что гедонистические модели дают гораздо лучшие результаты, чем родственные им метод простого среднего и метод сопоставления.

Одно из наиболее полных объяснений гедонистической модели принадлежит Энтони Овусу-Анса. Он разъясняет три широких подхода: параметрический, непараметрический и полупараметрический.

Параметрический метод предполагает, что кривая регрессии описывается конечным набором параметров, в которых модели взвешенных наименьших квадратов (WLS) решают основную проблему — гетероскедастичность. Недостатком является то, что несоблюдение модели может дать вводящую в заблуждение картину регрессионной зависимости.

Непараметрический подход позволяет избежать указания функции регрессии заранее, а включенными методами являются метод ядра, оценка ближайших соседей (NN) и локальная полиномиальная регрессия. Такой подход может привести к неточной оценке при большом количестве регрессоров («проклятие размерности»).

Полупараметрический сочетает в себе как параметрический, так и непараметрический подходы. Преимущество заключается в том, что он уменьшает проблемы, связанные с этими двумя подходами, включая неточность, обусловленную «курсом размерности».

В конце концов, нельзя сказать, что один подход лучше другого. Это зависит от исследований, которые мы проводим. При выборе одного из подходов количество сильных и слабых сторон не является фабрикой элиминаторов.

Аналитик множественной регрессии

Регрессионный анализ — это статистическая модель, используемая для определения взаимосвязи между переменными. Множественные регрессионные модели могут определить, какие характеристики наиболее важны для объяснения. Это позволяет прогнозировать цены, собирая независимые и зависимые переменные данные, такие как исследование Амины для выбранных домов в Малайзии.

Ловушка регрессионного анализа заключается в том, что он может давать неверные прогнозы результатов на основе выборки данных. Например, может появиться вводящее в заблуждение объяснение того, почему некоторые типы домов привлекательны, и причина этого в том, что число покупателей невелико.

Один из лучших примеров я нашел в исследовании Шалева, где он особо выделил пример американских избирателей, где огромную неоднородность невозможно охарактеризовать и зафиксировать в выборке из одной или двух тысяч избирателей.

Таким образом, любой недостаток использования модели множественной регрессии обычно связан с данными, которые мы используем.

Опорная векторная регрессия

Регрессия опорных векторов — это прогностическая модель, основанная на машине опорных векторов, нейронной сети, которая, естественно, имеет три слоя. Преимуществом является возможность обработки нелинейных результатов путем предоставления одного возможного оптимального решения, поскольку оно не зависит от распределения вероятностей.

Что меня впечатляет в регрессии SVM, так это то, что она может иметь одинаковую производительность при выборе признаков и извлечении признаков. Это означает, что уменьшение размерности не приведет к неточному результату.

Извлечение признаков предполагает сокращение ресурсов, необходимых для описания большого набора данных. При работе с задачами с большим количеством переменных нам нужен большой объем памяти, поэтому в этом случае уменьшение размерности поможет нам преодолеть эту проблему.

Искусственная нейронная сеть

Модель нейронной сети аналогична процессу, используемому при построении гедонистической ценовой модели. Разница в том, что нейросеть сначала нужно обучить как на ввод, так и на вывод (оценочная стоимость дома), которые производит модель.

t работает путем сравнения выпуска и фактического выпуска (фактической цены шланга), где точность определяется общей среднеквадратичной ошибкой. Когда мы говорим о производительности, на нее влияет количество скрытых слоев и количество узлов, включенных в каждый скрытый слой.