Исследование IPO-компаний
Иван Федотов, Александр Майоров, Алексей Резвов
10 октября 2020
Дисклеймер
Мы ответственно заявляем — никто не знает, куда пойдут финансовые рынки. И мы тоже не знаем. Мы публикуем данное исследование на правах частного мнения. При этом мы НЕ даем инвестиционных рекомендаций и НЕ призываем использовать результаты исследования. Все, что вы делаете, вы делаете на свой страх и риск.

Мы предупреждаем, что данная работа основана на исторических данных. История классная штука, но она не всегда повторяется. Поэтому прошлая доходность не гарантирует будущих результатов, и вы должны учитывать этот момент.

Также мы предупреждаем, что инвестиции в IPO — это высокорискованные инвестиции. Нельзя формировать инвестиционную стратегию, основываясь только на IPO-компаниях. Даже если вы решили инвестировать в IPO, то сделайте это на малую часть общего портфеля. Поберегите нервы и деньги — не заходите в IPO на весь капитал.
Оглавление
Что вы получите
Когда мы начали исследование, мы поставили задачу — обыграть слепой портфель IPO-инвестиций. Другими словами мы искали стратегию "Умный выбор" , которая опережает стратегию "Инвестируем во все IPO подряд". Результат нашей работы вы видите на графике.
Результаты исследования
График показывает теоретические портфели, которые смоделированы на исторических данных. Они отражают возврат инвестиций на вложенный $1. Слепой портфель (blind portfolio) отражает совокупную динамику всех IPO в первый год торговли. Умные портфели (selected portfolio) отражают динамику IPO, которые выбрал наш алгоритм.
Дальше по тексту — подробное описание факторов, которые мы изучили, а также выводов, к которым мы пришли. Важно понимать, что мы сделали исследование не ради научных изысканий или сферического IPO в вакууме. Вместо этого мы искали закономерности, которые применимы в прикладной биржевой торговле. Поэтому, если вы инвестируете в IPO, то исследование поможет улучшить ваш результат. В этом и состоят цель и практическая польза работы.
План исследования
Перед тем как нырнуть в омут работы, давайте определим дорожную карту и установим ключевые ориентиры. Это послужит хорошей стартовой точкой, а также поможет с дальнейшей навигацией.

Глобально мы разделили материал на пять последовательных частей:
1
Описание слепого портфеля, состоящего из всех IPO
2
Изучение факторов, которые влияют на успех IPO
3
Создание умного портфеля с помощью машинного обучения
4
Оценка результатов
5
Выводы
Кроме того, будет ряд промежуточных и дополнительных параграфов. Там мы ответим на специфичные вопросы и укажем новые точки роста.

При подаче материала мы использовали визуальное повествование. Другими словами мы рисовали графики и показывали максимальное количество информации с помощью минимального количества слов. Таким образом мы старались облегчить восприятие.

Также мы использовали простые термины, чтобы материал был понятен рядовому инвестору. Если конкретный термин (или график) нуждался в дополнительном объяснении, то мы делали отдельную сноску. Например, ниже мы объяснили, что такое слепой портфель, умный портфель и машинное обучение.
Что такое слепой портфель
Слепой портфель — это портфель, в котором мы не выбираем, нужно ли инвестировать в каждое отдельное IPO. Мы заходим подряд во все IPO, которые есть в нашем датасете.
Что такое умный портфель
Умные портфели — это портфели, которые составлены с помощью нашего алгоритма.
Что такое машинное обучение
Машинное обучение (или Machine Learning, ML) относится к методам искусственного интеллекта, которые учат компьютер самостоятельно находить решения различных задач. Компьютеры проводят аналитическую работу и определяют закономерности быстрее людей с помощью заранее загруженных данных и специальных алгоритмов. Большую понятную статью про машинное обучение можно найти здесь.
Теперь, когда организационные моменты закончились, давайте приступим к исследованию. Наш первый этап — описать датасет, с которым мы работаем.
Этап №1. Делаем первичный обзор датасета
Цель первого этапа — понять на концептуальном уровне, с чем конкретно мы имеем дело. Для этого мы ответим на следующие вопросы:
1
Сколько IPO мы изучаем?
2
Как IPO распределены по секторам?
3
Как IPO распределены по индустриям?
4
Сколько IPO торгуются на бирже, а сколько IPO ушли с рынка?
5
Какая доходность средней IPO-компании?
6
Какой риск средней IPO-компании?
Давайте приступим.
Количество IPO
Мы имеем 2046 компании в нашем датасете. Они выходили на IPO, начиная с января 1997 года и заканчивая июлем 2020 года. Эти компании провели размещение на основных биржах NYSE и NASDAQ. При этом одна половина компаний провела IPO и до сих пор торгуется на бирже. Другая половина имеет статус Delisted — то есть их акции ушли с рынка.
С 1997 по 2020 год на основные биржи NYSE и NASDAQ вышли 4190 компаний. Мы имеем надежные ценовые и финансовые данные по половине из них. Данные проверяли через несколько источников. Эти данные лягут в основу нашего исследования.
Как правило, компания получает статус Delisted по двум причинам — либо в результате банкротства (что плохо), либо в результате M&A-сделки (что хорошо). В разрезе нашей работы важна не столько причина, по которой компания ушла с рынка, сколько сам факт наличия данных. Он означает, что мы проводим исследование не только на "выживших" IPO, но и на компаниях со статусом delisted. Таким образом, мы избегаем ошибки выжившего.

Давайте посмотрим, сколько компаний выходило на IPO в зависимости от года:
Количество IPO по годам
Рынок плодороден на IPO в хорошие периоды (интернет-бум 1995-1999 годов, рост рынка с 2010 года) и скуден во времена кризисов. Это логично и объяснимо. Все хотят проводить IPO, когда рынок растет, и на него приходят дешевые деньги. Никто не хочет проводить IPO, когда цены падают, и инвесторы боятся покупать акции.
Доходность IPO
Теперь посмотрим доходности. Для начала определим среднюю доходность IPO в зависимости от года. В качестве точки входа мы используем цену закрытия в первый день IPO. Мы ориентируемся на цену закрытия первого дня , потому что это максимально пессимистичный сценарий. По ней инвестор может попасть в сделку, независимо от размера аллокации в момент IPO или скорости исполнения приказов в момент открытия биржи.

В качестве точки выхода мы используем цену закрытия через 250 торговых сессий. Это примерно соответствует одному календарному году.
Доходность IPO по годам
В хорошие годы среднее IPO растет на 20% и выше. В кризисы — падает на аналогичное значение. Среднегодовая доходность IPO для всего периода составляет ~10%.
Давайте детально изучим динамику котировок после IPO. Для этого мы построим теоретический слепой портфель. В нем отразим ежедневные усредненные изменения всех IPO за первый год после выхода на биржу.
Теоретический слепой портфель
График показывает усредненную динамику 2046 IPO, которые вышли на NYSE и NASDAQ за последние 23 года. Мы привели все IPO к одной точке во времени и зашли в них единым портфелем. 250 торговых дней, отраженных на графике, соответствуют одному календарному году.
Первое, что бросается в глаза — это сильная коррекция, которая начинается через 100 торговых сессий после выхода компании на биржу. Причем это не связано с рыночными условиями или другими внешними факторами. Наш теоретический портфель одновременно включает 2046 IPO из разных временны́х периодов и разных рыночных циклов. Поэтому условный кризис 2008 года компенсируется последующим восстановлением. Соответственно, причина, которая вызывает коррекцию, находится внутри IPO-компаний.

Также видно, что IPO-компании стабильно растут первые четыре месяца. Интересный момент — распространенный трехмесячный lockup-период, от которого инвесторы мечтают избавиться, приносит больше пользы, чем вреда. Фактически, он помогает дольше удерживать прибыльную позицию.

Другой вопрос в том, что подобный результат обеспечивают не широкий спектр акций, а ограниченное количество суперзвезд. Это хорошо видно, если не использовать среднюю доходность, а посмотреть медиану. Ну и, чтобы дважды не ходить, сразу добавим квантили.
Медианный и квантильные результаты слепого портфеля
В то время, как средняя доходность продолжает расти, медиана снижается. Фактически, большинство IPO-компаний падают примерно на 5% за первый год.
Лучшая четверть IPO в первый год растет на 35%, а лучшие 10% компаний — на 90%. Худшие 25% компаний и 10% компаний падают на 39% и 66% соответственно.

Что такое медианный портфель
Медианный портфель показывает доходность "самой средней" акции. Каждый день одна половина акций показала доходность выше медианы, а другая половина акций показала доходность ниже медианы.
Что такое квантильные портфели
Портфель "90 quantile" разбивает общий датасет на 90% и 10% IPO соответственно. Каждый день 10% лучших IPO показали доходность равную или выше, чем значение 90 квантиля.

Портфель "75 quantile" разбивает общий датасет на 75% и 25% IPO соответственно. Каждый день 25% лучших акций показали доходность равную или выше, чем значение 75 квантиля.

Портфель "25 quantile" показывает доходность 25% худших акций (она либо равна 25 квантилю, либо ниже его).

Портфель "10 quantile" показывает доходность 10% худших акций (она либо равна 10 квантилю, либо ниже его).
Риски IPO
При оценке инвестиционных активов неправильно смотреть только на доходность. Ее нужно сопоставлять с риском. Поэтому мы изучим два простых показателя риска — стандартное отклонение и максимальную просадку. Давайте сравним риск и доходность за 250 торговых сессий, что примерно соответствует календарному году.
Соотношение доходности и стандартного отклонения
Большинство IPO собирается в одной зоне, которую рынок считает оптимальным соотношением риска-доходности. При этом существует прямая зависимость между волатильностью и доходностью.

P.S. Данные логарифмированы.
Соотношение доходности и максимальной просадки
Максимальное падение IPO за первый год обычно составляет от 15% до 80% с относительно равномерным распределением внутри диапазона.
Сделаем сводную таблицу, куда соберем основные показатели количества IPO, риска и доходности за другие временны́е периоды. Возьмем следующие ключевые точки — 22 торговые сессии, 62 торговые сессии, 125 торговых сессий, 190 торговых сессий, 250 торговых сессий. Это примерно соответствует 1 месяцу, 3 месяцам, 6 месяцам, 9 месяцам, 12 месяцам.

Также мы рассчитаем коэффициенты Шарпа и Сортино, как распространенные показатели эффективности. Точнее мы рассчитаем средний Шарп IPO-компаний и средний Сортино IPO-компаний для основных временны́х периодов.
Таблица риска и доходности IPO-компаний в период 1997-2020
Выводы по первому этапу
Подведем итоги описательной части:
1
Мы имеем 2046 компаний в изучаемом датасете. Половина компаний имеет статус delisted и уже не торгуется на бирже. Больше половины компаний принадлежат секторам Healthcare или Technology.
2
Средняя доходность IPO в первые 4 месяца составляет 11%. Средняя доходность IPO в первый год составляет 10%.
3
Средняя доходность достигается за счет небольшого количества компаний, которые сильно выросли. Это хорошо видно, если сравнивать среднюю доходность с медианной доходностью.
4
Большинство компаний растут первые 100 торговых сессий, после чего наступает сильная коррекция. Затем акции медленно восстанавливаются до конца года.
5
IPO-компании — это волатильный актив. Поэтому даже рыночно-оптимальное соотношение риска и доходности находится в широком диапазоне значений. Средний коэффициент Шарпа колеблется в районе 0.15-0.25 для разных временны́х периодов.
Этап №2. Изучаем факторы, которые влияют на успех IPO
Цель второго этапа — найти особенности IPO-компаний, которые положительно влияют на динамику цен после размещения. Для этого мы рассмотрим три типа факторов:
1
Категориальные факторы
2
Характеристики IPO-сделки
3
Финансовые показатели
Категориальные данные
Под ключевым категориальным фактором мы понимаем сектор компании. Давайте посмотрим на количество IPO относительно этого фактора.
Количество IPO по секторам
Большинство IPO находятся в секторах Healthcare и Technology. Собственно, на два этих сектора приходится больше половины компаний.
Теперь посмотрим на среднюю доходность, которую обеспечивает каждый сектор. Особое внимание обратим на Technology и Healthcare, так как это самые популярные сектора для проведения IPO. То есть эти данные наиболее репрезентативны.
Доходность IPO по секторам
Доходности Healthcare и Technology превышают 10% и занимают второе и третье место соответственно. Интересный момент — лидером доходности является Basic Materials. Однако, причины этого непонятны. К тому же количество IPO из этого сектора менее 100 и, возможно, это просто случайность.
Продублируем два графика доходности-риска, которые мы видели выше. Посмотрим на них через секторальную призму.
Соотношение доходности и стандартного отклонения
Самые низковолатильные сектора — Energy и Real Estate. Они кластеризуются в одной зоне с низким стандартным отклонением и ограниченной доходностью. Самые экстремальные значения — Healthcare и Technology.

P.S. Данные логарифмированы.
Соотношение доходности и максимальной просадки
IPO технологических компаний чаще прочих показывают экстремальную доходность. Однако, с таким же энтузиазмом они падают на 80% и больше.

В этой плоскости более стабилен сектор Healthcare — доходность по-прежнему высокая, но плотность экстремальных падений ниже.
Характеристики IPO-сделки
Под характеристиками IPO-сделки мы подразумеваем три фактора:
1
Капитализацию компании, которая выходит на IPO (Market Cap).
2
Отношение привлекаемых средств к капитализации компании (Offer Amount / Market Cap).
3
Отношение расходов на IPO к привлекаемым средствам (Total Expenses / Offer Amount).
Market Capitalization
Начнем с капитализации. Построим scatter-графики, где оценим влияние фактора на доходность IPO. С помощью цвета сохраним разбивку по секторам.
MarketCap to Return
Чем выше капитализация, тем ниже вероятность показать большую доходность. Это логично. Изначально крупной компании тяжело взлететь еще выше. Удвоиться с капитализации в десятки миллиардов — совсем не то же самое, что удвоиться с базы $200-300m. Поэтому крупные ажиотажные компании, наподобие Uber или Lyft, имеют весьма ограниченный потенциал роста.
Offer Amount to Market Cap
С абсолютными цифрами мы разобрались, теперь посмотрим на производные параметры. Первый производный параметр — это отношение суммы размещения к размеру рыночной капитализации.
Offer Amount to Market Cap
Существует некоторое соотношение Offer Amount to Market Cap в районе 25%, где находятся акции с наибольшей доходностью. Если компания на IPO продает четверть своих акций, то вероятность выстрелить повышается.
Total Expenses to Offer Amount
Еще один производный параметр — отношение расходов на IPO (=комиссия инвестиционному банку) к сумме размещения.
Expenses to Offer Amount
Чем выше расходы на IPO, тем ниже вероятность выстрелить. Это логично. Чем меньше денег заходит непосредственно в компанию, тем хуже для бизнеса и для инвестиционной привлекательности.
Финансовые показатели
Финансовые показатели — наиболее многогранный инструмент для анализа. Даже при использовании базовых метрик финансовой отчетности мы получаем широкий перечень изучаемых факторов.

В данном исследовании в качестве базовых метрик мы взяли:

  • Revenue
  • Net Income
  • EBIT
  • EBITDA
  • Operating Income
  • Free Cash Flow
  • SG&A
  • CapEx
  • OpEx
  • Total Debt
  • Total Assets
  • Cash & Equivalents

Мы остановились на этих показателях по двум причинам:
1
Они наиболее распространены и понятны инвесторам.
2
Они максимально представлены в нашем датасете.
При этом все показатели отражают консолидированный финансовый результат за год до IPO. Мы можем получить эти данные перед размещением. Для этого нужно изучить форму S-1, которая находится в системе EDGAR на сайте Securities Exchange Commission. Кроме того, мы можем добавить значение Market Capitalization и отдельно рассчитать Enterprise Value.

Важно понимать, что финансовые показатели бессмысленно использовать в чистом виде. Поэтому мы рассчитали мультипликаторы и получили возможность относительной оценки. В таблице ниже — перечень мультипликаторов, которые мы использовали в качестве факторов для анализа.
Таблица финансовых мультипликаторов
Забежим вперед и отметим, что большинство мультипликаторов не имеют очевидной связи с доходностью IPO. Поэтому мы не будем описывать все соотношения. Мы ограничимся вариантами, где такая связь немного прослеживается. Для наглядности мы логарифмируем scatter-графики.
MarketCap to Revenue
Существует слабая обратная зависимость между мультипликатором и доходностью.
SG&A to Revenue
Для IPO из сектора Healthcare данные кластеризуются. На левом кластере существует слабая прямая зависимость.
OpEx to Revenue
Ситуация похожа на предыдущий график, но кластеры более волатильны (это видно по шкале мультипликатора).
Net Debt to MarketCap
Существует "плохое" значение мультипликатора, которое часто встречается в IPO с отрицательной доходностью. Можно постараться отсечь неудачные сделки, сместившись вправо или влево по шкале X.
Assets to MarketCap
Существует слабая прямая зависимость. Компании, которые находятся правее нуля, редко падают сильно.
Данные зашумленные, сильные очевидные связи отсутствуют. При этом мы понимаем, что не можем предсказать рост IPO на основе какого-либо отдельного фактора. Однако, в некоторых случаях мы можем отсечь выборки с высоким количеством провальных компаний. Также отметим, что экстремальные значения (причем и доходности, и факторов) часто находятся в секторах Healthcare и Technology. Что логично, поскольку это наиболее специфичные сектора.

На основании этого мы делаем заключение, что предсказать IPO простым и очевидным человеческому взгляду способом не получится. По крайней мере, на основе существующих финансовых данных. Поэтому мы применим методы машинного обучения, чтобы найти более глубокие неявные связи.
Лучшие и худшие 25% компаний
Cравним верхний и нижний квартили доходности IPO-компаний. Напомним, что лучшая четверть IPO показала доходность выше 35%, а худшая четверть IPO упала больше, чем на 39%. Попробуем найти разницу — посмотрим, как отличаются финансовые метрики лучших и худших компаний. Выпишем те из них, где мы видим логичные и существенные закономерности.
Сравнение лучших и худших IPO
60% компаний, которые показали высокую доходность, имеют положительный показатель Free Cash Flow. Рыночная оценка лучших компаний, как правило, ниже, чем рыночная оценка худших компаний.
В принципе все банально:
1
Лучшая четверть компаний чаще имеет положительные показатели прибыли и чистого денежного потока (Net Income, EBITDA, FCF), чем худшая четверть компаний.
2
Лучшая четверть компаний имеет более скромные мультипликаторы, чем худшая четверть компаний. Таким образом, акции этих компаний оценены ниже, и они имеют потенциал роста.
3
Лучшая четверть компаний имеет более низкие расходы, чем худшая четверть компаний. Лучшая четверть компаний имеет более высокую долю активов, чем худшая четверть компаний.
Метрик с видимыми закономерностями мало, но плюс в том, что они универсальные. Одна часть метрик отвечает за прибыльность компании, другая — за рыночную оценку. При этом более глубокие (или специфичные) мультипликаторы серьезных отличий не показали. Они одинаково представлены как в лучших, так и в худших IPO.
Выводы по второму этапу
В целом, по второму этапу мы делаем следующие выводы:
1
Не существует волшебного параметра, который однозначно характеризует успешные или неуспешные IPO. Так или иначе, на динамику цен влияют множество факторов. Видимые зависимости есть среди факторов, относящихся к характеристикам сделки.
2
Существует перекос в сторону секторов Healthcare и Technology по всем типам факторов. Одновременно с этим, в секторах Healthcare и Technology присутствует больше видимых закономерностей.
3
Компании с высокой рыночной капитализацией показывают меньшую доходность, чем компании с низкой рыночной капитализацией.
4
Большинство финансовых факторов не имеет очевидного влияния на результат IPO. Присутствуют слабые связи в отдельных мультипликаторах, но их трудно интерпретировать. Возможно, лучший результат даст сочетание нескольких факторов одновременно.
Этап №3. Применяем машинное обучение и прогнозируем результат IPO
Цель третьего этапа — научиться прогнозировать результат IPO на основе категориальных данных, финансовой отчетности и характеристик IPO-сделки. Поскольку аналитическая обработка финансовых данных показывает общую картину, но не позволяет выявить сильные связи, мы воспользуемся машинным обучением. В частности мы применим модель градиентного бустинга и библиотеку XGBoost.
Что такое бустинг
Бустинг — это один из способов машинного обучения. Достаточно просто и понятно этот способ объяснили в журнале "Код".
Определяем корреляцию факторов
Перед тем, как загрузить данные в машину, мы посмотрим корреляцию факторов. Для этого мы построим тепловую карту:
Несмотря на то, что многие факторы фундаментально похожи, нельзя сказать, что они сильно коррелируют между собой. Фактически, мы видим несколько корреляций выше 80% и одну корреляцию выше 90%. Поэтому мы выбросим один сильноскоррелированный фактор из выборки, а остальные будем использовать в полном объеме.
Используем машинное обучение и прогнозируем результат IPO
Чтобы прогнозировать результат IPO, мы используем модель градиентного бустинга. В качестве входных данных мы подаем факторы, которые описали на предыдущих этапах. В качестве цели задаем доходность IPO за определенный период.

Чтобы обучить и протестировать алгоритм, мы делим общий датасет (состоящий из 2046 IPO) на две части. Первую часть, которая составляет ¾ датасета, мы используем как данные для обучения алгоритма. Вторую часть, которая составляет ¼ датасета, мы используем как данные для тестирования. Если тестовый портфель, построенный алгоритмом, опережает слепой портфель, мы считаем это успехом. Если тестовый портфель, построенный алгоритмом, проигрывает слепому портфелю, мы считаем это провалом.

Чтобы исключить случайность из тестов, мы используем кросс-валидацию:
1
Перемешиваем первоначальный датасет
2
Делим перемешанный датасет на две части
3
Обучаем алгоритм
4
Строим и сравниваем портфели
5
Повторяем процедуру множество раз
Таким образом мы получаем множество слепых и умных портфелей, построенных на разных наборах IPO. Затем мы усредняем результаты и получаем итоговые слепой и умный портфели. Эти портфели очищены от случайности. Если итоговый умный портфель опережает итоговую слепую выборку, значит алгоритм работает.

Единственный минус кросс-валидации — сильное усреднение результатов и занижение параметров риска. График доходности, полученный с помощью кросс-валидации, будет очень красивый и ровный. Любые коэффициенты, которые сопоставляют риск с доходностью, будут завышены, а графики портфелей получатся чересчур плавными. Мы сможем сравнивать их между собой, но абсолютные значения будут нерепрезентативны.
Прогнозируем результат IPO через год
Давайте загрузим данные в машину и посмотрим, что получится. Входные параметры следующие:
1
Точка входа — цена закрытия 1-й торговой сессии.
2
Точка выхода — цена закрытия 250-й торговой сессии.
3
Цель алгоритма — найти IPO, которые покажут доходность больше 0.
Таким образом, мы получаем усредненные графики слепого и умного портфелей:
Умный 250-дневный портфель
(selected portfolio №1)
Заходим в первый день IPO по цене закрытия. Выходим на 250 день. Ищем IPO, которые покажут положительную доходность.

Портфель опережает слепую выборку на 4 процентных пункта за счет более быстрого роста после 130 дня.
Давайте поиграем с таргетами. Разобьем целевую доходность на три категории:
1
Хорошее IPO (прогнозируемая доходность выше 25%).
2
Среднее IPO (прогнозируемая доходность от -25% до 25%) .
3
Плохое IPO (прогнозируемая доходность ниже, чем -25%).
Мы используем эти диапазоны в качестве целей, потому что они разбивают датасет на три равные части и позволяют эффективно обучить алгоритм. Использование других диапазонов возможно, но это сильно усложняет задачу и допускает вероятность ошибок.
Умный 250-дневный портфель
(selected portfolio №2)
Заходим в первый день IPO по цене закрытия. Выходим на 250 день. Ищем IPO, которые покажут доходность выше 25%.

Портфель опережает слепую выборку в два раза за счет более быстрого роста на всей дистанции.
Умный 250-дневный портфель
(selected portfolio №3)
Заходим в первый день IPO по цене закрытия. Выходим на 250 день. Ищем IPO, которые покажут доходность в диапазоне от -25% до 25%, и заходим в них одинарной позицией. Ищем IPO, которые покажут доходность больше 25%, и заходим в них двойной позицией.

Результат почти идентичен первому портфелю.
Прогнозируем результаты IPO за другие временны́е периоды
Теперь поиграем с точками входа и выхода. Например, посмотрим, как алгоритм предсказывает акции до "великого падения". Параметры следующие:
1
Точка входа — цена закрытия 1-й торговой сессии.
2
Точка выхода — цена закрытия 100-й торговой сессии.
Умный 100-дневный портфель
(selected portfolio №1)
Заходим в первый день IPO по цене закрытия. Выходим на 100 день. Ищем IPO, которые покажут положительную доходность.

Портфель опережает слепую выборку на 3 процентных пункта.
Умный 100-дневный портфель
(selected portfolio №2)
Заходим в первый день IPO по цене закрытия. Выходим на 100 день. Ищем IPO, которые покажут доходность выше 15%.

Портфель опережает слепую выборку на 6 процентных пунктов.

Умный 100-дневный портфель
(selected portfolio №3)
Заходим в первый день IPO по цене закрытия. Выходим на 100 день. Ищем IPO, которые покажут доходность в диапазоне от -15% до 15%, и заходим в них одинарной позицией. Ищем IPO, которые покажут доходность больше 15%, и заходим в них двойной позицией.

Портфель опережает слепую выборку на 3 процентных пункта.
Теперь посмотрим, как алгоритм определяет акции после коррекции (на 130 день после размещения акций):
1
Точка входа — 130-й день.
2
Точка выхода — 250-й день.
Умный портфель после коррекции (selected portfolio №1)
Заходим на 130 день IPO по цене закрытия. Выходим на 250 день. Ищем IPO, которые покажут положительную доходность.

Портфель опережает слепую выборку в 2 раза.

Умный портфель после коррекции (selected portfolio №2)
Заходим на 130 день IPO по цене закрытия. Выходим на 250 день. Ищем IPO, которые покажут доходность больше 15%.

Портфель опережает слепую выборку в 2,6 раз.

Умный портфель после коррекции (selected portfolio №3)
Заходим в первый день IPO по цене закрытия. Выходим на 250 день. Ищем IPO, которые покажут доходность в диапазоне от -15% до 15%, и заходим в них одинарной позицией. Ищем IPO, которые покажут доходность больше 25%, и заходим в них двойной позицией.

Портфель опережает слепую выборку в 2,6 раз.

Собираем результаты в сводные графики
Соберем результаты в сводные графики, а также отразим доходности по годам и по секторам:
Сводный график 250-дневных портфелей
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 25%.
Selected №3 — x1, если от -25% до 25%; x2, если больше 25%.
IPO, которые чаще всего попадали в 250-дневные портфели. Средняя доходность по годам
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 25%.
Selected №3 — x1, если от -25% до 25%; x2, если больше 25%.

IPO, которые чаще всего попадали в 250-дневные портфели. Средняя доходность по секторам
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 25%.
Selected №3 — x1, если от -25% до 25%;
x2, если больше 25%.


Сводный график 100-дневных портфелей
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 15%.
Selected №3 — x1, если от -15% до 15%;
x2, если больше 15%.

IPO, которые чаще всего попадали в 100-дневные портфели. Средняя доходность по годам
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 15%.
Selected №3 — x1, если от -15% до 15%;
x2, если больше 15%.

IPO, которые чаще всего попадали в 100-дневные портфели. Средняя доходность по секторам
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 15%.
Selected №3 — x1, если от -15% до 15%;
x2, если больше 15%.


Сводный график портфелей
с 130 по 250 день
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 15%.
Selected №3 — x1, если от -15% до 15%;
x2, если больше 15%.

IPO, которые чаще всего попадали в портфели с 130 по 250 день. Средняя доходность по годам
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 15%.
Selected №3 — x1, если от -15% до 15%;
x2, если больше 15%.

IPO, которые чаще всего попадали в портфели с 130 по 250 день. Средняя доходность по секторам
Цели портфелей:
Selected №1 — больше 0%.
Selected №2 — больше 15%.
Selected №3 — x1, если от -15% до 15%;
x2, если больше 15%.

Выводы по третьему этапу
По третьему этапу мы делаем следующие выводы:
1
Машинное обучение позволяет прогнозировать результаты IPO на основе категориальных данных, финансовых данных и характеристик IPO-сделки.
2
С помощью фундаментальных данных и модели градиентного бустинга мы превосходим слепой портфель в два раза, если подразумеваем годовую дистанцию. Мы также превосходим слепой портфель на четырехмесячной дистанции, правда с меньшим отрывом.
3
Существуют периоды, когда алгоритм опережает слепую выборку. Также существуют периоды, когда он проигрывает. В целом успехи алгоритма крупнее провалов, поэтому средняя доходность растет.
Этап №4. Определяем важность факторов и прогнозируем крупные IPO
Первая цель четвертого этапа — найти факторы, которые сильно влияют на качество прогнозов. Вторая цель четвертого этапа — проанализировать отдельные размещения и понять, каким образом алгоритм выбирает акции.
Определяем важность факторов
Чтобы определить важность факторов, мы применим метод Permutation Importance. Суть метода следующая:
1
Мы берем первоначальный датасет факторов, на котором обучали алгоритм.
2
Перемешиваем значения единственного фактора между собой. Остальные факторы оставляем без изменений.
3
Запускаем алгоритм на тестовой части датасета. Смотрим результат.
Если результат прогнозов сильно меняется, значит фактор имеет большое значение. Перемешав его, мы изменили логику алгоритма. Если прогнозы остаются плюс-минус прежними, значит фактор неважный — логика алгоритма не изменилась несмотря на то, что мы исказили входные данные. Таким образом, последовательно перемешав каждый фактор, мы можем оценить его влияние на алгоритм.
Не все факторы одновременно используются в каждой конкретной стратегии. Однако, их совокупность полностью покрывает потребность прогнозной модели во входных данных.
Большинство факторов имеют очевидный смысл с точки зрения классического финансового анализа. Некоторые из них (например, FCF to Net Income) видимого смысла не показывают. Тем не менее они помогают алгоритму эффективно разбивать первоначальную выборку и классифицировать IPO на дальнейших этапах.

Больше половины факторов содержат показатель рыночной оценки компании. Это либо Market Capitalization, либо Enterprise Value. При этом мы не добавляли эти факторы искусственно — они самостоятельно сформировались в процессе Permutation Importance. Таким образом, алгоритм использует не только внутренние финансовые метрики, но также применяет рыночные мультипликаторы стоимости.
Прогнозируем крупные IPO
Отойдем от концепции совокупных портфелей и посмотрим, как алгоритм прогнозирует конкретные размещения. Это послужит дополнительной проверкой и лучше раскроет прогнозную модель.

В качестве примера мы возьмем 50 крупнейших IPO нашего датасета. Запустим бэктест. Результаты занесем в таблицу. Для удобства мы выделим правильные прогнозы зеленым цветом, а ошибочные подсветим красным. Внизу таблицы подсчитаем статистику.
Топ-50 крупнейших IPO по сумме размещения
(прогноз "Sell" означает, что нужно пропустить IPO)
На дистанции 100 торговых сессий мы получили скромные результаты, хотя они все равно опережают слепую выборку. Результаты за календарный год лучше — точность прогнозов превышает 60%, а средняя доходность сделки кратно растет. Если увеличить тестовую выборку до 150 крупнейших IPO, то динамика показателей сохранится. То же самое случится, если мы протестируем 150 крупнейших компаний или 150 последних IPO. Во всех случаях мы немного опередим слепой портфель на коротком промежутке и сильно превзойдем его в течение года.
Мы еще не пришли к окончательному выводу, в чем причина подобной закономерности. Основное предположение видим следующее:
1
В долгосрочной перспективе на динамику IPO влияют финансовые характеристики бизнеса. То есть акции растут, если существуют справедливые причины для роста. Акции падают, если справедливые причины отсутствуют.
2
В краткосрочной перспективе ситуация меняется. Финансовые показатели продолжают влиять на IPO, но делают это в меньшей степени. Непосредственно после размещения за динамику котировок отвечают другие факторы, которые пока остаются загадкой.
Так как алгоритм использует финансовые данные в основе прогнозной модели, он хорошо справляется с долгосрочной задачей и хуже определяет краткосрочных победителей. Соответственно, чтобы улучшить качество краткосрочных прогнозов, в модель нужно включить дополнительные нефинансовые факторы.
Воспроизводим главные деревья решений
Мы изучили отдельные размещения и поняли структуру прогнозов. Теперь разберемся с логикой алгоритма. Напомним, что наша модель использует метод градиентного бустинга и библиотеку XGBoost, чтобы прогнозировать IPO. Фактически, модель строит множество деревьев решений, отправляет им входящие данные и выдает результат.

Мы не будем воспроизводить деревья решений здесь, потому что это не имеет практического смысла. Во-первых, деревьев много, во-вторых, они длинные, в-третьих, они не всегда интерпретируются человеческой логикой.

Но если вы хотите понять суть алгоритма на концептуальном уровне, то пройдите по этой ссылке. Вы скачаете архив, который содержит двенадцать деревьев решений. Они лежат в основе отдельных стратегий. На самом деле XGBoost использует сильно больше деревьев, но конкретно эти ветки — ключевые. Ознакомившись с ними, вы поймете, каким образом алгоритм прогнозирует IPO.
Выводы по четвертому этапу
Из четвертого этапа мы узнали:
1
Чтобы прогнозировать IPO на основе финансовых данных, достаточно иметь 9 базовых метрик и 20 производных мультипликаторов. Дальнейшее добавление показателей не улучшает качество прогнозов.
2
На долгосрочную доходность IPO влияют финансовые характеристики компании. Связь между отдельными факторами и результатом IPO бывает сложной для человеческого понимания. Но она существует, и ее можно использовать.
3
На короткой дистанции прогнозы на основе финансовых данных работают хуже. IPO-компании подвержены внешнему влиянию, и оно находится за пределами финансовой отчетности. Кроме того, IPO-компаниям нужно время, чтобы цена акций отразила справедливую стоимость бизнеса.
4
Машинное обучение эффективно определяет убыточные IPO. Количество неудачных сделок падает, средняя доходность оставшихся растет. Фактически, алгоритм отсеивает 80% провалившихся компаний и за счет этого опережает слепой портфель.
Общие выводы по исследованию
В исследовании мы изучили 2046 IPO. Мы начали с общего описания компаний. Мы закончили прогнозированием доходности с помощью машинного обучения. Пришло время собрать ключевые выводы и подвести итог проделанной работы.
Что мы знаем про IPO
Доходность IPO компаний (относительно 1-го дня закрытия):
1
Средняя доходность IPO составляет 11% через четыре месяца после размещения и 10% через год после размещения.
2
Средняя доходность достигается за счет небольшого количества компаний, которые сильно выросли. Медианное IPO имеет отрицательную доходность. Основной способ получить положительное математическое ожидание при инвестициях в IPO — максимально долго удерживать прибыльную позицию.
3
Большинство IPO-компаний растут первые 18 недель после размещения. Затем происходит коррекция. Средняя доходность портфеля восстанавливается к концу года, но это также достигается за счет ограниченного количества суперзвезд.
Влияние характеристик IPO-сделки:
1
Ключевые характеристики сделки по размещению акций — Offer Amount и Market Capitalization.
2
Обе метрики важные и помогают прогнозировать ценовую динамику.
3
Значение мультипликатора Offer Amount to MarketCap имеет видимую связь с доходностью IPO.
Влияние финансовых факторов:
1
Финансовые показатели компании влияют на долгосрочную доходность IPO. В меньшей степени они влияют на краткосрочную доходность.
2
В большинстве случаев влияние финансовых факторов неочевидное. Нельзя прогнозировать IPO, если полагаешься на одну или несколько финансовых метрик. Приходится использовать сложные сочетания, чтобы выявлять глубокие связи.
Что мы не знаем про IPO
Три вопроса, которые заслуживают дополнительного изучения:
1
В чем причина коррекции, которая начинается через 18 недель?
2
Какие факторы, кроме финансовых, влияют на успех долгосрочных прогнозов?
3
Какие факторы, кроме финансовых, влияют на динамику IPO после размещения?
Как мы можем применить машинное обучение, чтобы прогнозировать IPO
Про машинное обучение в целом:
1
Мы смогли прогнозировать IPO с помощью машинного обучения. В исследовании мы успешно применили метод градиентного бустинга и библиотеку XGBoost.
2
Мы использовали машинное обучение, чтобы связать финансовые данные с доходностью IPO. Эта связь скрылась от описательной статистики, но проявилась при применении алгоритмических подходов.
Про алгоритм в частности:
1
В качестве входных данных мы использовали финансовые показатели компании и характеристики IPO-сделки. На выходе мы получили алгоритм, который классифицирует IPO на "хорошие" и "плохие" в зависимости от заданной цели.
2
Долгосрочные прогнозы алгоритма в два раза опережают слепой портфель. Краткосрочные прогнозы работают хуже, но также опережают слепую выборку.
3
Алгоритм отсеивает неудачные IPO и таким образом повышает среднюю доходность на сделку. Точность отсеивающих прогнозов достигает 70%.
4
В целом, лучше использовать долгосрочные прогнозы алгоритма. Стратегия, победившая на бэктестах — поиск IPO, которые дадут 25%+ годовой доходности.
Как мы можем улучшить результаты прогнозов
На принципиальном уровне мы можем улучшить алгоритм двумя способами:
1
Добавить новые факторы
2
Оптимизировать внутренние параметры
На практике мы используем оба подхода, но концентрируемся на первом. Новые данные выявляют новые закономерности. Некоторые из закономерностей фундаментально улучшают модель. Мы убедились в правильности решения, когда запустили Permutation Importance — добавление даже одного важного фактора работало эффективнее, чем оптимизация внутренних параметров. Поэтому в будущем мы сохраним аналогичную политику.

Факторы, которые мы добавим в следующую версию алгоритма:
1
Доходность широкого рынка на момент IPO
2
Доходность сектора компании на момент IPO
3
Среднесекторальное значение мультипликаторов на момент IPO
Мы изучим и другие факторы, по которым достанем данные. Собственно, основной процесс улучшения алгоритма состоит в поиске, обработке и проверке информации. Задачи, связанные с этим процессом, мы считаем приоритетными.
Несколько слов вместо заключения
Три философских совета, которые имеют математическое обоснование. Они затрагивают как инвестиции в целом, так и IPO в частности:
1
Диверсифицируйте активы
Не вкладывайте весь капитал в IPO-компании, а распределите его между разными классами активов. Не инвестируйте все деньги в одно размещение — соберите портфель IPO. Помните, что диверсификация снижает риск, защищает инвестиции и сохраняет нервы. Используйте эти преимущества.
2
Настройтесь на дистанцию
Перестаньте думать про отдельные сделки и начните мыслить глобально. Неважно, сколько вы заработаете завтра. Важно, сколько вы заработаете через 10 лет, когда пройдет хотя бы один кризис. Дьявол в деталях, но общее правило простое — чем долгосрочнее вы мыслите, тем больше шансов, что вы победите.
3
Не верьте в сказки
Забудьте про гарантированную доходность на финансовых рынках. Ее не существует. Также не существует стратегий, которые безошибочно прогнозируют рынок, или аналитиков, которые знают будущее. Если вам кажется, что вы нашли волшебный Грааль — поверьте, вам действительно кажется.
Советы очевидные, но инвесторы редко их соблюдают. Поэтому тот, кто соблюдает — в выигрыше.
Дочитали до конца?
Оставьте обратную связь! Так вы поможете нашей работе. А наша работа поможет вашим инвестициям.