Недвижимость, я пытаюсь инвестировать — 2 Chainz

Блин, мы снова к этому вернемся! Мы отвлечемся от рынка всего на секунду, чтобы обратиться к другому типу инвестиций, недвижимости. Я уверен, что вы похожи на меня, и что вам знать, что будет делать рынок жилья. Мечта состоит в том, чтобы рынок жилья немного рухнул, чтобы мы могли снизить цены, но не настолько, чтобы наше общество рухнуло вокруг нас, как во время великой рецессии 2008 года. С этого момента мы будем избегать использования слова r. (рецессия не та, о которой вы думаете)

Эта серия состоит из трех частей: (1) моя первая попытка использования алгоритмов, включая некоторые модели временных рядов и модели машинного обучения; (2) добавление в смесь других алгоритмов машинного обучения; и (3) анализ результатов, созданных успешными моделями, и вывод некоторых рекомендаций для принятия решений.

Мотивация

Недвижимость была самым популярным ответом, когда я спрашивал богатых людей, как они получили свои деньги. В их случаях это заняло время, но стоимость недвижимости росла десятилетиями. Аренда — это такая афера, когда вы платите, но это колени пчелы, когда вы находитесь с другой стороны. Кто-то другой живет на вашем месте, но оплачивает ваш платеж по ипотеке плюс дополнительные платежи. Это дерзость, когда ты арендатор, но дурь, если ты собираешь чеки.

Недвижимость прочная, поэтому мы постараемся снимать под углом. Это означает, что мы покупаем, когда рынок низок, а когда мы находимся в будущем бычьем рынке, мы можем продать с большой прибылью и, возможно, сделать что-то крутое.

Сбор и подготовка данных

Zillow предоставляет информацию о домах для продажи, недавно проданных домах, ипотечных ставках и стоимости жилья. У них также есть блог и советы о том, как купить или продать ваш дом. У Zillow есть бесплатные данные о ценах на жилье для каждого рынка в США, включая их собственные «Zestimates. Есть некоторые разногласия из-за новостей о том, что Zillow переплачивает за дома на основе их оценок, поэтому мы воспримем это как недоверие. Данные о жилье в Бостоне были примером, который я видел, и, вероятно, у вас тоже есть первые проекты в области машинного обучения, поэтому они общедоступны. Тем не менее, я нацелюсь на район Майами-Форт-Лодердейл, потому что я живу там и не планирую уезжать. Обертки Python для Zillow не подходят для этой задачи, поэтому нам просто нужно загрузить их прямо с веб-сайта.

Похоже, ранг размера ранжирует рынок по размеру. Однако, чтобы подогнать его под наши модели, нам нужно извлечь наш рынок. Нам придется немного изменить структуру. О, черт возьми, там много рынков. Давайте сузим его до Флориды. Района Форт-Лодердейл нет, поэтому для этой части мы будем использовать рыночные данные Майами.

Я опубликую этот колаб позже в нижней части истории. Я сделаю так, чтобы вы могли запустить модель на любом из этих рынков. Не волнуйся, детка, я тебя понял.

Модели и статистика

Как только мы извлечем данные, мы получим временной ряд средней цены дома. Поскольку все, что у нас есть, это временные ряды, мы также можем использовать некоторые классические прогнозы временных рядов. Посмотрим, как это выглядит.

Первое, что мы проверяем, является стационарным. Это явно не так, но на всякий случай мы все равно проверяем.

lol со значением p 0,89 Можно с уверенностью сказать, что оно нестационарное. Это не выглядит периодическим или имеет четкую тенденцию на протяжении всего временного ряда. К счастью, сезонная декомпозиция теперь очень проста, поэтому мы можем быстро выполнить декомпозицию для нескольких разных периодов, чтобы увидеть, можем ли мы сделать какой-либо тип удаления тренда или удаления сезонов, чтобы получить стационарный временной ряд и спрогнозировать его. В colab я запускаю несколько периодов, чтобы посмотреть, выглядит ли какая-либо декомпозиция красиво. Ни один из них не оказывается хорошим, поскольку остатки кажутся неправильными для всех из них. Большинство из них происходят примерно в одно и то же время, но в этом есть смысл: кризис 2008 года и недавняя пандемия 2020 года — эти временные ряды не были бы хорошими, поскольку те времена были непредсказуемы. Прогнозы, сделанные моделями временных рядов, могут быть не лучшей идеей. Здесь мы представим наш первый алгоритм машинного обучения. Прелесть моделей машинного обучения заключается в том, что большинство из них не заботятся об основных распределениях и в некоторых случаях являются лучшими предикторами, чем традиционные статистические модели.

Скрытые модели Маркова

Скрытые марковские модели — это стохастические модели пространства состояний, включающие случайные переходы между состояниями. Эти состояния могут быть разными рынками, которые испытывает рынок жилья, такими как медвежий, бычий и боковой. Может быть больше состояний, специфичных для отрасли, поэтому нам придется запускать эти модели с разными параметрами и решать, какое из них лучше, используя какой-либо тип метрики проверки. Если вы хотите узнать больше о скрытых марковских моделях, вам повезло, что я заранее написал целую статью. Проверьте ссылку ниже.



Давайте настроим нашу модель с нашим жильем, а затем предскажем будущие состояния.

Тестирование

Для тестирования я выбрал 3 состояния, так как медвежий, бычий и боковой рынки известны и, следовательно, у нас уже есть огромное количество торговых стратегий, которые мы можем использовать, если будем достаточно внимательно искать и достаточно захотеть протестировать. Впрочем, это будет отдельная тема, которой будет посвящена отдельная статья. Давайте закодируем скрытую марковскую модель с тремя неизвестными состояниями.

Первое испытание было совершенно ужасным. Проще просто показать, чем рассказать.

Кажется, что модель просто классифицирует состояния на основе значения y. Это действительно ничего не делает для нас. Итак, давайте попробуем изменить параметр и надеемся получить достойную модель. Давайте попробуем 2 состояния, однако из-за того, насколько ужасна модель, ежемесячные данные могут быть слишком «простыми», поскольку, поскольку она не сложна, она, скорее всего, просто разбросает состояния по значению y и не изменится.

Так что да..

Похоже, наша модель застрянет на этих значениях, независимо от состояния. К сожалению, мы можем двигаться дальше, так как у меня есть другие идеи для работы.

Выводы и будущие работы

Модели прогнозирования временных рядов не работали, как и скрытые марковские модели. Это печально, но иногда это процесс. Я решил все-таки выложить первую часть, потому что это часть процесса. Это не только захватывающие прорывы и замечательные идеи, но и много стойкости и неуверенности в себе. Если бы это было легко, у Zillow была бы империя недвижимости, но реальная жизненная ситуация требует нестандартного мышления и удачи. Часть 2 находится в стадии реализации, и ожидаются гораздо более многообещающие результаты с сентиментальным анализом и регрессией машинного обучения.

Оставайтесь с нами и спасибо за чтение!

https://colab.research.google.com/drive/1jkPP3NI-CdV4vtzuGSsSWA193tLbJf8u#scrollTo=rT6PO8XzvVBF