Токсичность потока заказов на спотовом рынке биткойнов

Взгляд на ВПИН

С августа 2020 года на Binance было продано более 800 миллиардов долларов биткойнов, номинированных в долларах США, - безусловно, крупнейшей биткойн-биржи. Как и на других рынках, большая часть ликвидности, предоставляемой на Binance, поступает от маркет-мейкеров: компаний, которые готовы как покупать, так и продавать биткойны в надежде, что они получат прибыль от спреда между покупателями и покупателями.

Что такое микроструктура рынка?

Теория микроструктуры рынка признает, что ценообразование определяется как внутренними, так и экзогенными факторами. Ликвидность, влияние на рынок, транзакционные издержки (проскальзывание), волатильность и механизм книги лимитных ордеров - все это играет существенную роль.

Классическая экономическая теория спроса и предложения предполагает, что любой инвестор, желающий покупать и продавать по равновесной цене, обычно может это сделать. В действительности же сам акт покупки или продажи ценной бумаги изменяет рыночную цену; торги имеют влияние на рынок.

Инвестор, который хочет купить или продать большое количество биткойнов, не выполнит весь ордер сразу. Вместо этого они будут делать это постепенно, с течением времени, чтобы покупать по самой низкой или продавать по самой высокой цене. Стэн Дракенмиллер, который вместе с Джорджем Соросом сломал Банк Англии в 1992 году, недавно упомянул, что он пытался купить 100 миллионов долларов в биткойнах в 2018 году. Из-за отсутствия ликвидности ему потребовалось две недели, чтобы купить 20 миллионов долларов. в этот момент он сдался.

Таким образом, влияние сделки на рынок играет важную роль в принятии инвестором решения о покупке или продаже ценной бумаги, что, в свою очередь, влияет на цену, по которой торгуется эта ценная бумага.

А как насчет токсичности потока заказов?

Все участники рынка входят на рынок в надежде получить прибыль, но маркет-мейкеры и трейдеры зарабатывают (или теряют) деньги принципиально разными способами. Маркет-мейкеры как покупают, так и продают биткойны в надежде получить спред между покупателями и покупателями. Трейдеры покупают и продают биткойны, потому что у них есть информированное или неосведомленное мнение о будущих изменениях цен.

Чтобы заработать спред между покупателями и покупателями, маркет-мейкеры должны активно управлять запасами как биткойнов, так и Tether. Когда торговые потоки уравновешены, они могут продавать биткойны по запросу и выкупать их обратно по цене предложения, получая прибыль. Однако, если торговые потоки становятся слишком несбалансированными, маркет-мейкерам становится труднее пролонгировать свои запасы с прибылью. Как правило, маркет-мейкеры затем увеличивают цену, которую они взимают за свои услуги - спрэд между ценой покупки и продажи, что увеличивает торговые издержки (проскальзывание) для трейдеров.

Маркет-мейкеры и трейдеры зарабатывают (или теряют) деньги принципиально разными способами

Цена покупки и продажи, по которой маркет-мейкеры готовы предоставить ликвидность, определяется степенью неблагоприятного выбора информированных трейдеров. Если потоки ордеров становятся несбалансированными из-за того, что информированные трейдеры покупают или продают биткойны, этот поток ордеров считается токсичным.

Токсичность потока заказов и внезапный сбой

В 2010 году три исследователя из Корнелла в сотрудничестве с Tudor Investment Group опубликовали статью, описывающую, как внезапный обвал 2010 года - во время которого промышленный индекс Доу-Джонса (DJIA) ненадолго упал на 9%, прежде чем немедленно восстановиться, - был вызван чрезмерным количеством падений. токсичность потока заказов.

Модель, использованная для определения токсичного потока ордеров - VPIN (вероятность информированной торговли с синхронизацией по объему) - достигла рекордных максимумов за час, предшествовавший внезапному сбою, и успешно предсказала то, что до сих пор считается загадочным событием.

Газета Tudor привлекла внимание средств массовой информации: в статье Bloomberg указывалось, что VPIN может помочь регулирующим органам предотвратить сбои, такие как падение 6 мая. Исследователи из Национальной лаборатории Лоуренса в Беркли показали, что система VPIN хорошо предсказывала события высокой волатильности на фьючерсных рынках с января 2007 года по июль 2012 года.

В блестящей более поздней статье те же авторы указывают, что высокая токсичность потока заказов не просто вытесняет маркет-мейкеров с рынка; если маркет-мейкеры вынуждены сбросить свои запасы в убыток, они могут истощить оставшуюся ликвидность вместо того, чтобы предоставлять ее.

В часы, предшествовавшие краху 6 мая, информированные трейдеры постоянно продавали свои позиции маркет-мейкерам, которые несли растущие убытки. Когда этим же маркет-мейкерам в конечном итоге пришлось свернуть свои позиции, результаты были катастрофическими. По словам исследователей: «крайняя токсичность может превращать поставщиков ликвидности в потребителей ликвидности».

Чрезвычайная токсичность может превратить поставщиков ликвидности в потребителей ликвидности - Микроструктура« внезапного сбоя »

Но что такое ВПИН?

VPIN основан на модели PIN, которая рассматривает торговлю как игру между тремя типами участников: информированными трейдерами, неинформированными трейдерами и маркет-мейкерами.

VPIN аппроксимируется как абсолютная разница между объемом покупки и продажи за историческое окно. Вместо выборки по времени, VPIN рассчитывается с использованием столбцов фиксированного объема. Например, вы можете пробовать один раз при обмене 1000 биткойнов.

Объем имеет тенденцию увеличиваться, когда на рынок поступает новая информация, и уменьшаться, когда ее нет. Таким образом, выборка по объему сродни выборке по изменчивости (и информационному потоку).

Ордер классифицируется как ордер на покупку, если покупатель является информированным трейдером; аналогично ордер классифицируется как ордер на продажу, если продавец является информированным трейдером. Подробнее об определении сделок на покупку и продажу дальше.

Выявление информированных сделок

Правило тика классифицирует информированные сделки на покупку и продажу путем определения торгового агрессора, то есть стороны, принимающей ценообразование. Трейдер, покупающий биткойны с помощью рыночного ордера, получит лучший спрос в книге заказов - выше среднего значения спроса и предложения. Это делает его агрессором. Если трейдер отправляет лимитный ордер на покупку биткойнов ниже среднего значения бид-аск, этот ордер может в конечном итоге исполниться, если другой трейдер агрессивно продает биткойны через рыночный ордер.

Правило тиканья идентифицирует торгового агрессора, полагаясь на простое наблюдение. Агрессивные ордера на покупку, как правило, увеличивают цену актива, так как ордер соответствует самому низкому предложению в книге ордеров. Точно так же агрессивные заказы на продажу, как правило, снижают цену актива после того, как будет подобрана самая высокая ставка. Последующее изменение цены может быть использовано для идентификации торгового агрессора.

Сделки, которые вызывают последующее повышение цены, помечаются как 1 - покупка. Сделки, которые привели к снижению цены, помечаются как -1 - продажа. Сделки, которые не вызывают изменения цены (потому что они не полностью выполнили самую высокую ставку или самую низкую цену предложения), помечаются предыдущим тиком.

Проблемы с правилом клеща

Хотя правило тиканья (как правило) успешно определяет сторону агрессора, некоторые недавние исследования показывают, что трейдеры на стороне агрессора и информированные трейдеры могут не быть эквивалентными на высокочастотных рынках. Например, информированный трейдер может просто подать несколько лимитных ордеров по всей книге заказов, отменить те, которые не заполняются, и по-прежнему отображаться неинформированными в соответствии с Правилом тиков.

Первоначальная реализация VPIN использует байесовский подход, называемый Классификация массового объема (BVC), чтобы приблизительно определить долю информированного объема покупки и продажи в каждом баре (на основе времени или объема). Мой практический опыт работы с BVC был довольно неоднозначным. Вместо того, чтобы использовать BVC, я решил пойти с другим вариантом: использовать торговые теги, которые указывают, был ли покупатель или продавец маркет-мейкером в необработанных данных Binance Trade.

Binance публикует данные о торговле в реальном времени через поток Websocket, который я собирал на сервере AWS с начала августа прошлого года; вот откуда берутся мои данные. С марта 2021 года вы также можете скачать исторические данные здесь.

Взгляд на ВПИН

Я рассчитал VPIN, используя скользящие долларовые бары с примерно 1600 выборками в день с размером окна 1000. Это означает, что каждый сегмент тома, строго говоря, не имеет точно такого же размера. Даже в этом случае различия минимальны, поэтому я чувствую себя комфортно, используя исходную реализацию, без необходимости утяжелять отдельные ведра.

В отличие от первоначальной реализации, объемы покупок и продаж классифицировались с помощью тегов уровня торговли, которые указывают, был ли покупатель маркет-мейкером или нет. Кроме того, в отличие от исходной реализации, VPIN не является стационарным.

Дисбаланс потока заказов, похоже, значительно уменьшился за последний год, поскольку рыночная капитализация и объем торгов биткойнами увеличились. Это согласуется с исследованиями, показывающими, что более крупные акции имеют более низкие спреды спроса и предложения, что подразумевает менее неблагоприятный выбор.

Несбалансированность потока заявок между заявками на покупку и продажу со стороны агрессора, приведшая к последней коррекции - 19 мая 2021 года, - кажется минимальной. Относительно низкий показатель VPIN означает, что токсичность не повлияла на коррекцию.

Иногда кажется, что локальный дисбаланс потока ордеров достигает пика непосредственно перед резким падением цены - 12 и 18 июня являются лучшими примерами. Однако это могло быть просто чтение диаграммы.

Прогнозирование меток с тройным барьером с помощью VPIN

VPIN не обязательно был предназначен для прогнозирования будущих доходов. Вместо этого он просто описывает средние, взвешенные по объему дисбалансы потока ордеров за историческое окно. Знание этих дисбалансов не обязательно может использоваться для прогнозирования сохранения, увеличения или уменьшения будущих дисбалансов. Тем не менее, я подумал, что могу попробовать.

Я использовал довольно стандартную настройку, предложенную Маркосом Лопесом де Прадо - следующий абзац покажется тарабарщиной для тех, кто не знаком с финансовым машинным обучением, поэтому не стесняйтесь его пропустить.

Я рассчитал метки тройного барьера с поправкой на волатильность, чтобы классифицировать образцы как длинные или короткие позиции. Максимальная ширина этикетки ограничена 3,5% в любом направлении; попадания в вертикальный барьер классифицируются по абсолютной доходности по длине позиции. Я рассчитал веса выборки на основе средней уникальности. RF обучается с использованием 100 деревьев, соответствующих максимальных выборок для каждого дерева, не более одного объекта на дерево и максимальной глубины 6. Данные масштабируются, очищаются, блокируются (5%) и перекрестно проверяются в пяти случаях. . Прочтите первые две части книги Маркоса, если вас интересуют подробности.

Поскольку в конце прошлого года, похоже, произошел резкий прорыв в VPIN, я решил использовать данные только за последние шесть с половиной месяцев; итак, около месяца данных на сгиб. Это составляет в общей сложности ~ 250 000 сэмплов.

Как и в исходной статье, я установил метрику VPIN с использованием логнормального распределения и обучил модель на CDF VPIN. Я использовал семь различных размеров окна: 50, 100, 250, 500, 1000, 2500 и 5000. Кривые ROC для всех пяти складок показаны ниже.

Модель явно отстает в среднем от теста 0,5 AUC, в то время как производительность варьируется в зависимости от ситуации. Тем не менее, кривая ROC и показатель AUC могут быть не лучшим способом оценки производительности (CDF) VPIN.

Оценка конечной производительности VPIN

Проблема с кривой ROC в финансовом машинном обучении заключается в том, что они не дают хорошего представления о конечной производительности. Вполне возможно - и даже вероятно, - что VPIN не влияет на ценообразование в нормальных рыночных условиях. Действительно, маркет-мейкеры ожидают колебаний между объемом покупки и продажи; это просто стоимость ведения бизнеса.

Я хочу знать, имеет ли биткойн прогностическую способность чрезвычайно высокой или низкой токсичности потока ордеров в экстремальных рыночных условиях. Ответ (ниже) вроде бы да.

Посмотрите на кривые точного отзыва

Кривая Precision Recall отображает компромисс между Precision и Recall для разных пороговых значений. В этом случае он показывает, что при очень высоких порогах, то есть очень низких уровнях отзыва (0,05 и ниже), средняя точность модели при определении длинных позиций по всем пяти сгибам повышается до пятидесяти (и, возможно, даже до шестидесяти). При пороге 0,6 для всех пяти складок случайный лес правильно определяет 75% длинных позиций, даже если AUC намного ниже 0,5.

Кривая Precision Recall для коротких позиций говорит о том же. Несмотря на то, что средняя AUC остается ниже 0,5 на всех пяти кривых, наблюдается всплеск точности при очень высоких порогах.

Это говорит о том, что VPIN может иметь прогностическую способность только в очень редких случаях - возможно, один или два раза в месяц в этом наборе данных, самое большее.

Роль волатильности

Рынки обычно ведут себя по-разному в периоды высокой и низкой волатильности. Предсказуемость некоторых функций заметно снижается во время шока волатильности, в то время как другие функции (в том числе микроструктурные характеристики рынка) становятся более актуальными.

Измерения токсичности потока заказов могут быть особенно актуальны на рынке, который уже является нестабильным, где маркет-мейкеры уже расширили спред, при котором они предоставляют ликвидность. Если, помимо борьбы с высокой волатильностью цен, информированные трейдеры также неблагоприятно выбирают маркет-мейкеров, это может сформировать своего рода «двойной удар» (я, конечно, здесь чисто спекулирую).

Продолжая эту линию спекуляций, маркет-мейкеры могут с большей вероятностью понести убытки на очень волатильном рынке. Это увеличивает вероятность того, что они сбросят свои запасы (как это произошло во время Flash Crash 2010 года), что приведет к снижению цен.

Оценка VPIN с помощью порога волатильности

Порог волатильности удаляет все выборки из набора данных, где волатильность падает ниже определенного эталона. Например, в этом наборе данных порог волатильности 0,02 исключает примерно три пятых данных, но приводит к значительным улучшениям в AUC, длинной кривой точного отзыва и короткой кривой точного отзыва.

Показатель AUC повышается с 0,49 (хуже, чем у случайного классификатора) до солидных 0,55. Показатель AUC во всех складках, кроме одного, намного превышает контрольный показатель 0,5.

Для кривых Precision Recall включение порога волатильности, по-видимому, резко повысило точность по множеству пороговых значений. Похоже, что VPIN обладает значительно большей предсказательной способностью на рынках, которые уже являются волатильными.

Конечно, возможно, что я (в некотором роде) переоценил данные. Более полный анализ применил бы тот же подход к другим криптовалютам, таким как Ethereum, Ripple и Cardano, чтобы гарантировать, что VPIN действительно может предсказывать движение цен и что его прогностическая способность возрастает с волатильностью.

Мысли на прощание

Маркет-мейкеры играют одну из самых важных ролей на бирже - они обеспечивают ликвидность. Однако, когда информированные трейдеры снимают свои заказы, эти поставщики ликвидности несут убытки. Затем они сталкиваются с выбором: они могут увеличить стоимость своих услуг или - в тяжелых случаях - полностью уйти с рынка. Анализируя дисбаланс потока ордеров между объемом покупки и продажи, мы можем моделировать взаимодействие между информированными трейдерами и маркет-мейкерами.

Токсичность потока ордеров не только может быть хорошим предиктором краткосрочной волатильности - кажется, что в некоторых (очень) редких случаях она может даже предсказать более крупные ценовые движения.

Прогнозирующая способность VPIN резко возрастает, когда рассматриваемый рынок уже достаточно волатилен. Я могу только догадываться о причинах, но на самом деле вижу две.

Во-первых, маркет-мейкеры работают с очень тонкой маржой. Следовательно, они с большей вероятностью понесут большие убытки из-за неблагоприятного выбора на более волатильных рынках.

Более того, спрэды на волатильных рынках уже довольно широки. Токсичность потока ордеров - в дополнение к волатильности - может резко увеличить спреды (и издержки проскальзывания для трейдеров). Когда это происходит, торговля становится очень дорогостоящей; Я предполагаю, что трейдеры с меньшей вероятностью будут покупать из-за сильного воздействия цены, но все равно будут вынуждены продавать, если рынок рухнет.

Спасибо за внимание. Любые комментарии, мысли и идеи приветствуются. Не стесняйтесь писать мне на [email protected].