Винный Инвестинг

Акции, восстановленные после COVID-19. Машинное обучение приходит, чтобы объяснить.

Использование машинного обучения для выявления общих факторов среди акций, которые вернулись в норму после краха COVID-19.

Примечание редакции: Towards Data Science - это издание Medium, в основном основанное на изучении науки о данных и машинного обучения. Мы не являемся специалистами в области здравоохранения или эпидемиологами, и мнения, изложенные в этой статье, не следует интерпретировать как профессиональные советы. Чтобы узнать больше о пандемии коронавируса, нажмите здесь.

В этой статье я использую машинное обучение для изучения компаний, которые пострадали от COVID-19, как и все остальные, и теперь вернулись к нормальной жизни, в отличие от многих других. Чтобы лучше проиллюстрировать, что произошло, давайте взглянем на индекс S&P 500 в самое нестабильное время на рынках в недавнем прошлом.

Этот крах COVID-19 положил конец прекрасному десятилетию бычьего рынка, в результате чего цены акций упали на 33% в период с 20 февраля по 23 марта 2020 года. негативное влияние на фондовый рынок, не все компании пострадали одинаково. Ниже представлено распределение доходности на фондовом рынке для 1500+ публично торгуемых компаний США за этот период.

На оси X я показываю рост цен с 20 февраля 2020 г. по 23 марта 2020 г. На оси Y я показываю процент компаний, сообщивших об этом росте.

Мы видим, что большинство компаний демонстрируют отрицательный рост. Распределение выглядит нормальным со средним значением около -33% и некоторыми выбросами в положительном диапазоне доходности. Отличная возможность представляет собой выявление компаний, которые были атакованы несправедливо. Когда инвесторы начали паниковать и выводить свои средства с рынков, почти все компании потеряли в цене свои акции. Когда паника закончилась и рынок начал постепенно исправляться (как всегда), компании, которые имели разумные цены до COVID-19 Rampage начали возвращаться к исходным ценовым уровням, оставив позади компании, заслуживающие коррекции.

Ниже приведен график, показывающий доходность во время этапов падения и восстановления кризиса COVID-19 (по состоянию на 1 мая 2020 г.).

Данные Drop на этих гистограммах взяты из предыдущего графика. Данные восстановления показывают доходность рынка в период с 23 марта по 1 мая 2020 г. сразу после того, как рынок достиг дна. Сообщается о доходности восстановления по сравнению с 23 марта 2020 г. Это важно отметить, поскольку падение доходности составляет -50% и восстановление, возврат 50% не то же самое. Например, падение на -50% может означать падение цены с 200 долларов в феврале до 100 долларов в марте. В этом случае доходность восстановления в размере 50% будет означать рост со 100 долларов в марте до 150 долларов в мае, покрывая половину первоначальных убытков.

Финансовые данные

Для этого исследования я использую Alpha Dataset с сайта www.vhinny.com, который предоставляет фундаментальные финансовые данные, включая балансы, отчеты о доходах и отчеты о движении денежных средств за прошлые периоды. 8 лет. Я также использую бесплатный API AlphaVantage для доступа к ежедневным ценам на акции.

Постановка задачи

В этом исследовании я пытаюсь определить движущие силы компаний, которые быстро восстановились после того, как их цены были смыты коррекцией COVID-19. Понимание этих факторов повышает ценность инвесторов, которые стремятся защитить себя в будущем и воспользоваться этой возможностью. Более конкретная постановка проблемы такова:

Чтобы определить профили компаний, которые потеряли не менее 25% своей цены в период с 20 февраля по 23 марта и выросли как минимум на 25% в период с 23 марта по 1 мая 2020 года.

Методология

Есть много способов решить эту проблему, от неконтролируемой кластеризации до прогнозного моделирования. Подход, который я использую здесь, основан на прогнозном моделировании. Я не собираюсь обучать модель, предсказывающую рецессию в будущем. Вместо этого я стремлюсь к пониманию прошлого. Помня об этой цели, я считаю, что простая разбивка дерева решений является лучшим методом для работы.

Деревья решений печально известны тем, что они не соответствуют обучающим данным. Благодаря этому свойству они почти никогда не используются в прогнозном моделировании, уступая место Случайному лесу и XGBoost. Однако, в отличие от других алгоритмов, Деревья решений обеспечивают точное представление о процессе принятия решений, показывая исследователю, как именно было принято решение.

Я формулирую проблему как задачу классификации, отмечая компании, которые потеряли не менее 25% своей цены, а затем прибавили не менее 25% как положительные примеры. Только 10% компаний, указанных в данных, соответствуют этому условию. Затем я подбираю дерево решений со следующими параметрами:

  • Максимальная глубина: 10
  • Минимальное количество образцов на листе: 5
  • Максимальное количество конечных узлов: 10

Поскольку моя цель - объяснить прошлое, а не предсказывать будущее, я не разбивал данные на наборы для обучения и проверки, как это было бы в типичной задаче прогнозирующего машинного обучения. Параметры, которые я использовал, также не являются лучшими параметрами для разделения положительных и отрицательных примеров. Вместо этого я выбрал параметры, чтобы ограничить проблему размерами, которые можно легко интерпретировать. Таким образом, немного жертвуя производительностью, я могу определять и визуализировать фундаментальные тенденции в данных, а это именно то, что я ищу.

Реализация и результаты

На графике ниже показано дерево решений, подходящее для выявления компаний, которые потеряли не менее 25% своей цены в период с 20 февраля по 23 марта и выросли как минимум на 25% в период с 23 марта по 1 мая 2020 года.

Это дерево решений соответствовало фундаментальным финансовым данным более 1500 публичных компаний США. Каждый узел имеет метку (класс), классифицирующую каждый узел как положительный или отрицательный, в зависимости от того, каково большинство примеров на этом узле. Я использую цветовую схему красный-белый-синий, чтобы визуализировать баланс положительных и отрицательных сторон на каждом узле. Сплошной красный означает, что подавляющее большинство примеров положительные. Сплошной синий означает, что большинство примеров отрицательные. Цвет становится более размытым по мере того, как соотношение положительных и отрицательных примеров приближается к равенству. А становится белым (полностью прозрачным), если количество положительных примеров равно количеству отрицательных. Стрелки представляют разделение на основе условия, отмеченного на самом узле. Стрелка влево разделяет примеры, удовлетворяющие условию, оставляя примеры, не соответствующие условию, стрелкой вправо.

Мировые тенденции

Наиболее важным разделением импорта, определенным этой моделью, является рыночная капитализация. Его самое первое решение - изолировать компании с рыночной капитализацией ≥ 120 миллионов долларов. Важно отметить, что он больше не преследует средние ограничения и большие, оставляя правый лист только с 990 отрицательными и 77 (из 150) положительных примеров на нем. Хотя модель решила пометить 65% данных как отрицательные при первом разбиении, это не означает, что нет возможности идентифицировать эти 77 положительных примеров на правом листе. соответствие. Это означает, что их неоптимально идентифицировать с учетом ограничений, которые я установил в дереве решений (параметры). Вместо этого у него больше шансов на оптимизацию для достижения цели с учетом ограничений, указанных в левом листе.

Положительные листья

Левая ветвь имеет шесть (6) положительных узлов. Каждый из этих узлов имеет свой собственный уникальный путь (набор условий), который инвестор должен применить, чтобы попасть туда. Общие тенденции можно вывести, сформулировав историю каждого пути.

Международные риски и изменение капитальных обязательств

После того, как компании были сужены до компаний с малой капитализацией, следующей точкой разделения был определен Влияние обменных курсов. Учитывая характер данных, вероятно, не так важно, сколько денег было заработано или потеряно из-за обменного курса, а скорее, компания работает на международном уровне и подвержена влиянию обменных курсов. Положительный лист среди компаний с малой капитализацией был обнаружен среди компаний, которые подвержены риску изменения обменного курса (работают на международном уровне) и сообщили об увеличении обязательств по операционному капиталу более чем на 4 миллиона долларов. Изменение в обязательствах по операционному капиталу является частью раздела о движении денежных средств по операционной деятельности в Отчете о движении денежных средств. Сам по себе он не очень показателен, поскольку обычно уравновешивается изменением операционных активов, которое не было идентифицировано алгоритмом . Единственное наблюдение, которое я могу сделать отсюда, - это то, что в балансе компании произошли некоторые изменения.

Долг

Идя по пути, начатому в предыдущем разделе, и следуя компаниям с изменением обязательств по операционному капиталу ≤ 4 миллиона долларов, мы оказываемся в узле, оценивающем погашение долга компании. Хотя оценка погашения долга является сложной задачей, в первую очередь, без знания того, какой размер долга у компании, оценка отношения долга к собственному капиталу более проста. Узел Долг к собственному капиталу включает 11 компаний, причем 6 из 11 являются положительными. Пять (5) из этих положительных компаний имеют отношение долга к собственному капиталу выше 5%. Это несколько парадоксальный вывод, поскольку хорошие компании обычно характеризуются как компании с меньшим объемом долга. Однако 5%, вероятно, слишком хорошо, чтобы быть правдой, поскольку это указывает на то, что компания почти полностью финансируется за счет собственного капитала или имеет что-то необычное в своей отчетности. Отношение долга к собственному капиталу 5% + дает нам 5 из 6 положительных примеров на этом узле.

Помимо банкротства

Другой положительный лист идентифицирует компании, которые не имеют ощутимого международного воздействия и имеют отрицательный Z1 показатель банкротства (например, в плохое финансовое состояние). В этой ситуации 8 из 11 компаний, которые увеличили свои запасы не менее чем на 280 тыс. Долларов, были правильно отмечены как положительные. Это наблюдение предполагает, что инвесторы могут рассматривать рост товарных запасов как признак прихода бизнеса, поддерживающего компанию, несмотря на плохие финансовые показатели.

Другой лист выявил компании, которые в предыдущем финансовом году продали ценных бумаг на сумму более 3,3 млрд долларов. Поскольку информации о том, что они купили, нет, сложно дать разумную интерпретацию того, какой чистый эффект это произвело. Учитывая, что это условие выявило 4 из 6 положительных примеров правильно, одна из гипотез может заключаться в том, что эти компании избавились от ценных бумаг незадолго до того, как COVID-19 обесценился их ценности, оставляя этим компаниям достаточно денег, чтобы вызвать доверие инвесторов.

Заключение

В этой статье я разбил финансовые показатели более 1500 публичных компаний США, которые потеряли не менее 25% своей цены в период с 20 февраля по 23 марта и выросли как минимум на 25% в период с 23 марта. и 1 мая 2020 г. Мои данные показывают, что между акциями малой капитализации могут быть обнаружены относительно простые отношения. Отсутствие долга среди компаний с малой капитализацией показало противоречивую взаимосвязь, установив границу отношения долга к собственному капиталу около 5%. Почти все компании с соотношением долга к собственному капиталу 5% не восстановили курс своих акций так быстро, как компании, у которых выше 5% долга к собственному капиталу соотношение сделал. Компании, которые увеличили свои запасы в предыдущем финансовом году, несмотря на плохие финансовые показатели, смогли быстро восстановить стоимость своих акций. Компании, получившие ощутимую выручку от продажи ценных бумаг в предыдущем финансовом году, также продемонстрировали быстрое восстановление.

Пожалуйста, найдите код, подтверждающий это исследование, здесь.

Спасибо, что прочитали мою статью! Если вам понравилось, вы можете проверить это:



Давайте подключимся!

Я счастлив общаться с людьми, которые разделяют мой путь - стремление к финансовой независимости. Если вы также стремитесь к финансовой независимости или хотите сотрудничать, высказывать идеи или обмениваться мыслями, не стесняйтесь обращаться к нам! Вот несколько мест, где меня можно найти:

  • Www.vhinny.com - платформа инвестиционных исследований, которая предоставляет финансовые данные для вашего собственного анализа.
  • Https://www.linkedin.com/company/vhinny - присоединяйтесь к нашему сообществу в LinkedIn, где я и другие участники делимся контентом, связанным с инвестициями.

Ваше здоровье!