Ниже приводится сокращенная и слегка измененная версия рабочего документа Radicle по экономике стартапов, в котором мы исследуем пост-денежные оценки с помощью классификации стадий венчурного капитала. Мы обнаруживаем, что оценки обладают интересными распределительными свойствами, а затем с легкостью переходим к описанию классической статистической модели для оценки нераскрытой оценки. С учетом сказанного, мы рекомендуем полностью прочитать эту статью перед использованием модели. Это не волшебство, и детали важны. С учетом сказанного, возьмите кофе и устраивайтесь поудобнее - мы углубляемся.

Вступление

Часто бывает трудно понять значение цифр, которые используются в экономике стартапов. Если компания привлекает серию F на 550 миллионов долларов при оценке в 4 миллиарда долларов [3] «» - насколько это реально? Как это соотносится с другими раундами Серии F? Является ли этот раунд приблизительно средним по сравнению с историческими финансовыми событиями или это аномалия?

В Radicle, компании, занимающейся исследованиями подрывов, мы используем науку о данных, чтобы лучше понять предпринимательскую экосистему. Стремясь устранить непрозрачность экономики стартапов, мы провели эмпирическое исследование, чтобы лучше понять природу оценок после получения денег. Хотя широко распространено мнение, что начальные раунды, как правило, проводятся по оценкам где-то от 2–10 млн долларов [18], данных, подтверждающих это, не так много, и неясно, как на самом деле выглядят оценки. последующие этапы финансирования. Однако, оглядываясь на исторические события, мы можем увидеть некоторые анекдотически интересные сходства.

Google и Facebook, прежде чем они стали нарицательными, каждый из них организовал раунды серии A с оценками в 98 и 100 миллионов долларов соответственно. Совсем недавно Instacart, компания по доставке продуктов, и Medium, социальная издательская сеть, в которой вы в настоящее время читаете это, подняли раунды серии B с оценками в 400 и 457 миллионов долларов соответственно. Instagram не сильно отличался на этом этапе, с оценкой Series B в 500 миллионов долларов до его приобретения Facebook в 2012 году. Еще один шаг вперед: Square (NYSE: SQ), Shopify (NYSE: SHOP) и Wish, e - торговая компания, которая бросает вызов Amazon, все привлекли раунды серии C с оценкой ровно в 1 миллиард долларов. Casper, частный стартап, направленный непосредственно на потребителя, разрушивший индустрию матрасов, поднял аналогичную серию C с оценкой после получения денег в 920 миллионов долларов. По общему признанию, это, вероятно, только систематическое сходство в ретроспективе, потому что человеческий разум запрограммирован на то, чтобы видеть закономерности, даже когда их нет, но это все же заставляет нас задаться вопросом, существует ли какая-то основная тенденция. Наши исследования показывают, что есть, но почему это важно?

Мы считаем, что предприниматели, венчурные капиталисты и профессионалы, работающие в сфере корпоративных инноваций или слияний и поглощений, могут извлечь большую пользу из эмпирического представления об оценке стартапов. Финансирование новых компаний объявляется ежедневно, и наличие большего количества общедоступных исследований на основе данных помогает любому, кто занимается стартапами, принимать более обоснованные решения. Тем не менее, это исследование предназначено исключительно для информационных целей, и наш онлайн-инструмент не является заменой внутренних, с нуля, методов и инструментов оценки, уже установленных сообществом венчурного капитала. Вместо этого мы думаем об этом исследовании как о дополнительном - устранении асимметрии информации и обеспечении более конструктивного обсуждения для принятия решений относительно оценок.

Осмысление оценок стартапов

Мы получили данные для этого анализа из Crunchbase, базы данных венчурного капитала, которая объединяет финансовые события и связанные метаданные о предпринимательской экосистеме. Наша выборка состоит из 8 812 финансовых событий с 2010 года с публично раскрытыми оценками и соответствующей классификацией венчурных стадий. В таблице I ниже представлена ​​сводная статистика.

Чтобы лучше понять природу оценок после получения денег, мы оценили их распределительные свойства с помощью ядерной оценки плотности (KDE), непараметрического подхода, обычно используемого для аппроксимации функции плотности вероятности (PDF) непрерывной случайной величины [8]. Проще говоря, KDE рисует распределение интересующей переменной, анализируя частоту событий, как это делает гистограмма. Непараметрический - это просто причудливый способ сказать, что метод не делает никаких предположений о нормальном распределении данных, что делает его идеальным для упражнений, в которых мы хотим нарисовать распределение вероятностей, но не имеем предварительных знаний о том, как оно на самом деле выглядит. .

Два графика непосредственно вверху и внизу внизу показывают функции плотности вероятности оценки для стадий венчурного капитала в логарифмической шкале с вертикальными линиями, обозначающими медианное значение для каждого класса. Почему в логарифмическом масштабе? Что ж, пост-денежные оценки распределены по степенному закону, как и большинство вещей в области венчурного капитала [5], что означает, что большинство оценок имеют низкие значения, но есть длинный хвост редких, но исключительно высоких оценочных событий. С технической точки зрения, пост-денежные оценки также можно описать как логарифмически нормально распределенные, что просто означает, что использование натурального логарифма оценок дает кривые колокола, с которыми мы все так хорошо знакомы. Оценки серий A, B и C можно утверждать как бимодальные логнормальные распределения, а начальные оценки могут приближаться к мультимодальности (подробнее об этом позже), но помимо технической суеты, эта деталь важна, потому что логнормальные распределения легко вычислить. чтобы понять, используя общий язык среднего, медианного и стандартного отклонения - даже если нам придется возвести в степень термины, чтобы поместить их в знаки доллара. Что еще более важно, это позволяет нам рассматривать классические статистические методы, которые работают только тогда, когда мы делаем строгие предположения о нормальности.

Основатели, которые ищут венчурный капитал для развития своей компании, обычно начинают с привлечения ангела или посевного раунда. Раунд ангелов состоит из капитала, привлеченного от их друзей, членов семьи или богатых людей, в то время как посевные раунды обычно являются первым раундом капитала стартапа от институциональных инвесторов [18]. Средняя оценка ангела и посевного материала составляет 2,2 миллиона долларов США, в то время как медианная оценка предварительной оценки составляет 1,9 миллиона долларов США. Хотя мы ожидали некоторого совпадения между оценками ангелов, предварительных посевных и начальных оценок, мы были удивлены, обнаружив, что распределения для этих трех классов раундов почти полностью перекрываются. Это означает, что эти ранние классификации в действительности очень похожи. Тем не менее, мы считаем, что выборка ангелов может быть смещена в сторону более крупных событий, о которых сообщается, поэтому мы по-прежнему немного скептически относимся к совпадению. И, как упоминалось ранее, распределение оценок начальной стадии, похоже, приближается к мультимодальности, то есть имеет несколько режимов. Это может быть связано с изменением определения посевного раунда и недавней институционализацией предварительных посевных раундов, которые равны или меньше 1 миллиона долларов в общей сумме привлеченного капитала и только недавно начали классифицироваться как «предварительные посевные» в Crunchbase. (и, следовательно, небольшой размер выборки). Также существует четкий режим в распределении начальной оценки около 7 миллионов долларов США, который частично совпадает с распределением серии A, предполагая, как и другие недавно, что некоторые подмножества посевных раундов отодвигаются дальше и напоминают раунды серии A за 10 лет. назад [1].

Около 21 процента компаний на стадии посевного материала переходят к выращиванию Серии A [16] примерно через 18 месяцев после выращивания семян - примерно 50 процентов компаний Серии A переходят к Серии B еще через 18–21 месяц. [17]. За это время медианная оценка выскакивает до 16 миллионов долларов в Серии A и до 130 миллионов долларов в Серии B. В серии C оценки продолжают расти до медианы 500 млн долларов. В целом, мы думаем, что интересно увидеть биномиальный характер, а также степень совпадения распределений оценок в сериях A, B и C. Возможно, что совпадение связано с изменениями в поведении инвесторов, когда общий размер и оценка на каждом этапе постоянно меняются. Точно так же, как некоторая доля посевных раундов сегодня - это то же самое, что и раунды Серии A 10 лет назад, данные показывают, например, что некоторая доля раундов Серии B сегодня совпадает с раундами Серии C. Это было дополнительно подтверждено, когда мы сегментировали данные по десятилетиям, начиная с 2000 года, и сравнили полученные распределения. Отметим, однако, что изменения очень постепенные и не такие сенсационные, как часто сообщается [12].

Средняя оценка стартапов достигает 1 миллиарда долларов между стадиями серии D и E и 1,65 миллиарда долларов на стадии F. Это отвечает на наш первоначальный вопрос, в результате чего оценка Peloton в 4 миллиарда долларов составляет 81 процентиль оценок на стадии серии F, что намного выше. медиана и действительно выше медианной оценки в 2,4 миллиарда долларов для компаний серии G. Отсюда мы видим значительный скачок к медианным оценкам серий H и I в 7,7 и 9 миллиардов долларов соответственно. Распределение серии I имеет заметно более низкий пик плотности и более высокую дисперсию из-за меньшего размера выборки. Мы знаем, что компании редко заходят так далеко, поэтому этого и следовало ожидать. Lyft и SpaceX, оцениваемые в 15 и 27 миллиардов долларов соответственно, являются недавними примерами компаний, которые вышли на этап первой серии. (Примечание: в декабре 2018 года SpaceX организовала раунд серии J, классификация которой не анализируется в этой статье.)

Мы классифицировали каждую стадию на классы более высокого уровня, используя вышеприведенные распределения, как ранний (ангел, предварительный посев, семя), рост (серии A, B, C), поздний (серии D, E, F, G) или Частное IPO (серии H, I). С помощью этих агрегированных классификаций мы дополнительно исследовали, как оценки меняются с течением времени, и обнаружили, что медианы (и средние значения) были более или менее стабильными в логарифмической шкале. Что изменилось с 2013 года, так это появление «частного IPO» [11, 13]. Эти раунды, описанные выше для таких компаний, как SpaceX, Lyft и других, таких как Palantir Technologies, проводятся позже и по более высокой оценке, чем существовавшие ранее. Эти частные раунды на поздних стадиях настолько высоко оценены, что будущие IPO, если они когда-либо состоятся, могут закончиться падением [22].

Приближение нераскрытой оценки

Учитывая вышеизложенное, мы разработали простую статистическую модель для прогнозирования оценки раунда после получения денег на основе классификации этапов и суммы привлеченного капитала. Почему это может быть полезно? Что ж, взаимосвязь между привлеченным капиталом и оценкой после получения денег верна по математическому определению, поэтому мы не заинтересованы в утверждении установления причинно-следственной связи в классическом смысле. Оценка стартапа после получения денег равна внутренней оценке до получения денег, рассчитываемой инвесторами во время инвестирования, плюс сумма привлеченного нового капитала [19, 21]. Однако оценки до получения денег часто не раскрываются, поэтому статистическая модель для оценки нераскрытой оценки будет полезна, когда доступен размер раунда финансирования и его стадия либо также раскрыта, либо легко предположительно.

Мы сформулировали обычную модель регрессии по методу наименьших квадратов и логарифмической регрессии, посчитав, что у нас недостаточно стадийных классификаций и полных наблюдений на каждом этапе для многоуровневого моделирования, и что было бы желательно построить модель, которая могла бы быть легко понятна и использована основателями. инвесторы, руководители и аналитики. Формально наша модель имеет вид:

где y - итоговая оценка после получения денег, c - сумма привлеченного капитала, r - двоичный термин, обозначающий стадию финансирования, и эпсилон - термин ошибки. Следовательно, log (c · r) - термин взаимодействия, который определяет размер капитала, привлеченного на определенном этапе. Модель, которую мы представляем, не включает этапные основные эффекты, потому что модель остается той же, независимо от того, оставлены они или вынуты, в то время как коэффициенты становятся повторными параметризациями исходных оценок [23]. Другими словами, основные эффекты логической стадии регулируют константу и коэффициенты, сохраняя при этом эквивалентные суммированные значения - увеличивая умственную гимнастику, необходимую для интерпретации, без добавления какой-либо статистической мощности к регрессии. Основные эффекты капитала не включены, потому что знания предметной области и приведенные выше распределения предполагают, что финансовые события всегда указывают на стадию развития компании, поэтому эффект не является фиксированным, и поэтому включение капитала само по себе приводит к неверно указанной модели наряду с условиями взаимодействия. Конечно, другой вопрос, согласована ли стадия классификации инвесторами и учредителями и указана ли она в таблице условий.

Как стандартная практика, мы использовали устойчивые стандартные ошибки гетероскедастичности для оценки коэффициентов бета, а анализ остатков с помощью графика подобранных значений по сравнению с остатками подтверждает, что модель подтверждает общие допущения обычной регрессии наименьших квадратов. Между переменными нет мультиколлинеарности, и график Q-Q дополнительно подтвердил, что данные распределены нормально логарифмически. Результаты являются статистически значимыми на уровне p ‹0,001 для всех терминов с скорректированным , равным 89 процентов, и F-статистикой, равной 5 900 (p‹ 0,001 ). В таблице II представлены результаты. Денежные значения в модели указаны в миллионах долларов США.

Модель можно интерпретировать, решая для y и дифференцируя по x, чтобы получить предельный эффект. Следовательно, мы можем рассматривать процентное увеличение x как ведущее к некоторому процентному увеличению y. На начальном этапе, например, для 10-процентного увеличения привлеченных денег компания может рассчитывать на 6,6-процентное увеличение своей оценки после получения денег, при прочих равных условиях. Эта премия увеличивается по мере того, как компании продвигаются по воронке венчурного капитала, достигая пика на этапе I серии с увеличением стоимости на 12,4% на 10% увеличения привлеченного капитала. На практике аналитик может приблизиться к неизвестной оценке после получения денег, указав сумму капитала, привлеченного на соответствующем этапе модели, возведя в степень константу и член бета и умножив значения таким образом, чтобы :

Используя первое уравнение и значения в Таблице II, предполагаемая нераскрытая оценка стартапа после получения денег после начального раунда 2 млн долларов составляет примерно 9,4 млн долларов США - для серии B 35 млн долларов США - 224 млн долларов - и для серии 200 млн долларов США. D, это 1,7 миллиарда долларов. Вычитание суммы привлеченного капитала из расчетной оценки после получения денег даст расчетную оценку до получения денег.

Неужели все так просто? Что ж, это полностью зависит от вашего варианта использования. Если вы хотите приблизить оценку и у вас нет инструментов для этого, и вы не можете поговорить по телефону с основателями компании, то приведенных выше расчетов должно хватить для этой цели. Если вместо этого вы заинтересованы в покупке компании, это хорошая отправная точка для обсуждения, но вы, вероятно, захотите использовать и другие методы оценки. Как упоминалось ранее, это исследование не предназначено для замены существующих методологий оценки, установленных сообществом венчурного капитала.

Что касается ошибок оценки, то из приведенного выше графика разброса вы можете сделать вывод, что для прогнозов на ранних стадиях вы можете ожидать, что оценки будут отклоняться на несколько миллионов долларов - для компаний на стадии роста - на несколько сотен миллионов - и поздние и частные этапы IPO, отставание на несколько миллиардов было бы разумным. Конечно, точность любого прогноза зависит от надежности оцененных средних значений, т. Е. От вероятных интервалов апостериорных распределений в рамках байесовской модели [6], а также от размера ошибки из-за смещения пропущенной переменной, что не является незначительный. Мы можем переформулировать нашу модель в прямо сопоставимых вероятностных байесовских рамках, в векторной записи, как:

где распределение log (y) с учетом X, матрицы условий взаимодействия n · k, является нормальным со средним значением, которое является линейным функция X, ошибки наблюдения независимы и имеют одинаковую дисперсию, а I представляет собой единичную матрицу n · n. Мы аппроксимируем модель неинформативным плоским перед использованием пробоотборника без разворота (NUTS), расширения гамильтонова алгоритма Монте-Карло MCMC [9], для которого наша модель сходится соответствующим образом и имеет желаемый волосатый гусеница выборочные свойства [6].

95-процентные вероятные интервалы на рисунке V предполагают, что апостериорные распределения от ангела до серии E, за исключением предпосевного, имеют стабильные диапазоны весьма вероятных значений вокруг наших исходных коэффициентов OLS. Однако на более поздних стадиях распределения становятся более неопределенными, особенно для серий F, G, H и I. Это должно быть очевидно, учитывая наши первоначальные размеры выборки для класса предпосевных культур и для более поздних стадий. Поскольку данные необходимо преобразовать обратно в исходный масштаб для соответствующей оценки, а также тот факт, что величина раундов на поздних стадиях имеет тенденцию быть очень высокой, такие изменения экспоненты приведут к кардинально разным результатам прогнозирования. Как и в случае с любым простым инструментом, ваш опыт может отличаться. Для получения более точных оценок мы предлагаем нанять специалиста по данным, который построит более сложный алгоритм машинного обучения или байесовскую модель, чтобы учесть больше функций и иерархию. Если ваш бюджет не позволяет этого, простой расчет с использованием оценок, приведенных в таблице II, поможет вам ориентироваться.

Заключительные замечания

В этом документе представлена ​​эмпирическая основа того, как думать об оценке стартапов, и представлена ​​статистическая модель как простой инструмент, помогающий практикам, работающим с венчурным капиталом, приблизиться к нераскрытой оценке после получения денег. Тем не менее, информация в этом документе не является инвестиционным советом и предоставляется исключительно в образовательных целях из источников, которые считаются надежными. Исторические данные - отличный индикатор, но никогда не гарантия будущего, а статистические модели никогда не бывают правильными - только полезными [2]. В этом документе также не дается никаких комментариев по поводу того, приводят ли текущие методы оценки к точному представлению справедливой рыночной стоимости стартапа, поскольку это отдельное обсуждение [7].

Это исследование может также послужить отправной точкой для других, чтобы продолжить свои собственные прикладные исследования в области машинного обучения. Мы превратили модель, представленную в этой статье, в более мощный алгоритм обучения [8] с большим количеством функций, которые заполняют недостающие пост-денежные оценки в нашей собственной базе данных. Эти оценки затем передаются в Startup Anomaly Detection ™, алгоритм, который мы разработали для оценки вероятности того, что стартап с венчурным капиталом будет иметь ликвидность, такую ​​как IPO или событие приобретения, с учетом текущего уровня знаний о них. Наша система машинного обучения, похоже, имеет некоторое сходство с другими, недавно раскрытыми GV [15], подразделением венчурного капитала Google и Social Capital [14], за исключением того, что наши оценки вероятности доступны как часть исследовательских продуктов Radicle.

В ближайшие годы компании, вероятно, продолжат собирать еще более поздние и более крупные раунды, и оценки на каждом этапе могут продолжать пересматриваться, но теперь у нас есть статистический взгляд на оценки, а также более глубокое понимание их распределительных свойств, что дает нам основу для понимание разрушения, когда мы смотрим вперед.

Библиографические ссылки доступны в полном формате PDF.