Ссылка: https://arxiv.org/pdf/1410.1231.pdf

Резюме статьи: Учитывая, сколько измерений имеют данные о транзакциях биткойнов, Шах и Чжан понимают, что стандартной регрессии недостаточно для прогнозирования будущих цен биткойнов. Они решают использовать байесовскую регрессию, в которой используются данные наблюдений, которые выступают в качестве суррогата для использования байесовского вывода, для построения «Модели скрытого источника».

Этот отчет обращается к широкому спектру технических интересов благодаря включению передовых статистических методов, подробного объяснения того, как они используют параллельные вычисления для обработки огромных объемов данных, а также математической основы, которую они используют для разработки своей стратегии высокочастотной торговли. Хотя этой статье уже три года, это один из самых математически сложных отчетов, которые я когда-либо видел в отношении моделей прогнозирования биткойнов. Учитывая ее возраст, было бы интересно посмотреть, как модель работала с момента написания статьи, учитывая, насколько с тех пор выросла цена. Мне интересно, сможет ли он справляться с резкими колебаниями цен за такие короткие периоды времени и при этом точно предсказывать будущие цены. Может ли он выдержать падение на 20% за один день? Тем не менее, он по-прежнему блестяще работал с данными, которые ему предоставили, и приносил исследователям значительную отдачу. Учитывая, насколько хорошо работала их модель, упомянутые методы явно заслуживают большого внимания.

Информация в этом материале также может вдохновить на групповые проекты для нашего клуба, где каждый участник может внести свой вклад в соответствии со своими интересами. Например, у меня есть опыт параллельных вычислений, и я мог бы запускать алгоритмы и распределять их соответствующие вычисления на несколько ядер, используя MPI или CUDA. В конце документа они упоминают, что им пришлось использовать репрезентативные временные ряды, и признают, что модель была бы более точной, если бы использовались все временные ряды. Это было бы намного более затратным в вычислительном отношении и, таким образом, было бы препятствием для их модели. Было бы интересно изучить, как можно сделать вычисления более эффективными в этой модели, чтобы можно было использовать больше данных.

Помимо анализа методов распределенных вычислений, мы также можем извлечь уроки из их стратегии HFT. Учитывая, что многие из наших участников интересуются торговыми алгоритмами, мы можем имитировать некоторые из их методов при построении собственной модели, особенно когда мы имеем дело с криптовалютой.

Независимо от того, над чем наш клуб начнет работать после прочтения этой статьи, я ожидаю увидеть больше подобных статей, вышедших из академических кругов, учитывая, насколько популярным стал биткойн за последние несколько месяцев. Без сомнения, у нас будет больше материала для работы.