На смену машинному обучению приходит глубокое обучение, которое выбирают инвесторы, стремящиеся предсказать успех стартапа. Но академические исследования глубокого обучения на сегодняшний день ограничены. EQT Motherbrain меняет это.

В поисках единорога

Жизнь стартапа коварна. Когда все сделано правильно, они являются источником инноваций, революционных изменений и масштабируемых возможностей. Многие из наиболее важных сегодня экономических и социальных разработок могут быть обеспечены стартапом.

Но эти положительные аспекты почти всегда сводятся на нет с первого дня. Ограниченное финансирование и нехватка человеческих ресурсов — это лишь две основные проблемы, с которыми мы сталкиваемся с момента создания. Ранние этапы проходят редко, что также затрудняет выявление победителей. Это как «увидеть единорога в дикой природе».

Но для венчурных капиталистов это название игры. Они стремятся выявлять стартапы-единороги и инвестировать в них на ранних стадиях, надеясь получить высокую отдачу. Чем может помочь глубокое обучение?

Это то, на что EQT Motherbrain попытался ответить. Совместно с соавторами из Стокгольмской школы экономики и Стокгольмского университета мы недавно провели исследование по обзору опубликованной литературы, посвященной проблеме прогнозирования успеха стартапов с использованием методов глубокого обучения. Мы очень рады поделиться этим публично в нашем последнем рабочем документе.

От машинного обучения к глубокому обучению

Чтобы не полагаться полностью на человеческий опыт и интуицию, инвесторы обычно используют подходы, основанные на данных, для прогнозирования вероятности успеха стартапов. За последние два десятилетия отрасль претерпела смену парадигмы, перейдя от традиционных статистических подходов к ориентации на машинное обучение (ML).

Примечательно, что недавний быстрый рост объема и разнообразия данных быстро приводит к глубокому обучению («ГО»), подмножеству МО, как потенциально превосходному подходу с точки зрения емкости (сколько данных может вместить модель) и выразительности (сколько типы данных, которые модель может аппроксимировать). Однако всестороннего синтеза существующих исследований на основе DL еще не было. Это оставляет многих практиков неосведомленными и уязвимыми для некоторых ловушек, скрытых в девяти ключевых задачах: определение масштаба проблемы, определение успеха, сбор данных, обработка данных, разделение данных, выбор модели, оценка модели, объяснение модели и создание модели.

Чтобы преодолеть эти проблемы, EQT Motherbrain провела синтез литературы по методам, основанным на DL, рассматривая материал с практической точки зрения. Основные статистические данные и выводы представлены с девяти точек зрения (соответствующих девяти вышеупомянутым задачам) в виде рабочего документа. Прочитав этот документ, практикующий специалист в этой области сможет получить более полное и глубокое понимание методологий оценки стартапов с помощью DL, а также извлечь ценные и полезные знания.

Мы хотели бы услышать ваше мнение о бумаге. Если у вас есть какие-либо вопросы, пожалуйста, напишите авторам Леле Цао ([email protected]) или Вильгельму фон Эренхайму ([email protected]).