Мар 14, 2022
Инвестиции на базе математики
691
≈3 min
Share
Инвестиции на базе математики

Как Quantum Capital инвестирует с помощью машинного обучения — в интервью с сооснователем компании Ахметом Бяшимовым

Прошло пять месяцев с нашей прошлой встречи. Как вы прошли этот сложный период?

— Год действительно непростой. Лето было очень хорошим для рынков, но с сентября волатильность повысилась ввиду перегретости в акциях технологических компаний, очередной волны коронавируса и все время откладываемым фискальным стимулом в США. Из-за этого сложно сейчас заходить в акции, но чем страшнее покупать – тем правильнее момент входа, уж исторически так сложилось.

С июня мы очень хорошо заработали для наших клиентов, а это значит больше доверия и уверенности в нашей стратегии. За пять месяцев Quantum Capital вырос в два раза, мы расширили команду и внедрили машинное обучение в процесс инвестирования.

Сейчас много ажиотажа вокруг искусственного интеллекта. Многие говорят, что внедряют ИИ в свои процессы. Что вы подразумеваете под машинным обучением?

— Путаницы с терминологией действительного много. В академии искусственный интеллект – это любая программа, которая может делать выводы или прогнозы на основе данных, неважно, каким способом – глубокими нейронными сетями или правилами «если — тогда». А машинное обучение – это подраздел искусственного интеллекта, в котором алгоритм уже самостоятельно должен находить статистические зависимости в данных. Но в обиходе люди обычно подразумевают под искусственным интеллектом обучение с подкреплением, компьютерное зрение и понимание текста.

К примеру, шахматный компьютер Deep Blue является частью «искусственного интеллекта», но не «машинного обучения», так как правила в нем записали его разработчики, а не он сам нашел выигрышные стратегии. Также работает и большинство алгоритмических торговых стратегий – разработчики автоматизируют условия для покупки или продажи акций в ответ на какое-то событие.

В результате компании на деле могут использовать простейшие линейные регрессии или предустановленный набор правил «если — тогда» и при этом честно заявлять об использовании искусственного интеллекта. Но потребители/инвесторы при этом остаются в заблуждении.

Мы под машинным обучением подразумеваем как раз свойство наших алгоритмов самостоятельно обучаться на данных, но мы не используем термин «искусственный интеллект», чтобы не создавать путаницы.

Как машинное обучение применяется в инвестиционной сфере?

— В нашей отрасли у машинного обучения есть нюанс, который отличает его от общей науки аналитики данных. Так, стремительный темп развития машинного обучения в первую очередь объясняется тем, что в основном это open-source-проекты и исследования. То есть почти все новейшие разработки есть в открытом доступе и каждый может внести свой вклад в эту науку. Но машинное обучение в инвестиционной сфере является в этом плане исключением – лидеры не могут делиться своими прибыльными разработками, так как это по сути растворяет возможность заработать. В инвестиционном машинном обучении каждый сам за себя и каждая компания – это, по сути, исследовательский центр, который проверяет разные теории с целью найти ту самую золотую жилу.

Также стоит отметить, что финансовые рынки достаточно эффективны, чтобы сделать процесс создания алгоритма машинного обучения непростым занятием. Есть множество научных работ в этой сфере, которые заявляют о создании прибыльной модели, но есть и немало опровергающих статей. Если вчитываться в методологию статей с достаточной скрупулёзностью, то во многих случаях можно найти изъяны, которые делают работу неприменимой или в корне неверной. Также очень много работ покрывают менее доступные рынки – биржи Бразилии, Турции, Индии и так далее. Это означает, что научная литература является лишь отправной точкой в нашей работе и реальные алгоритмы необходимо создавать самостоятельно.

Как решает эту задачу Quantum Capital?

— В первую очередь – с помощью подходящих людей. В Казахстане сейчас очень большой спрос на толковых специалистов в этой области – аналитиков данных. Нам же, учитывая отсутствие общедоступных разработок, необходимы были не просто разработчики машинного обучения, а эксперты, которые способны вчитываться в подходящие статьи, создавать и тестировать новые методы. Можно смело сказать, что это больше научно-исследовательская работа, чем стандартное программирование.

Второй важный момент – это оборудование. Тренировка моделей машинного обучения – это очень интенсивный процесс, где обычный офисный компьютер может потратить месяцы на вычисления. Мы под заказ собирали компьютеры, чтобы при необходимости запускать тренировку на графических ускорителях от Nvidia. Самые сложные расчеты мы будем запускать на облачных инфраструктурах.

Третья колонна – данные. Для прогнозирования финансовых рынков можно использовать как чистые цифровые данные, например цены закрытия и объемы торгов, так и тексты новостей, аудио-конференц-звонков и даже фотографии нефтяных барж со спутников. В Quantum Capital мы приобрели API-доступ к биржевым данным и новостям в реальном времени.

И какие у вас результаты?

— Мы начали с попытки использовать рекуррентные нейронные сети для прогнозирования финансовых показателей компаний, которые в свою очередь могут предсказать цены акций. К сожалению, модель не дала должных результатов ввиду высокой вероятности переобучения при долгосрочном прогнозировании. Мы также проверили на прибыльность немало индикаторов технического анализа, предоставив моделям машинного обучения возможность найти лучшие параметры для каждого индикатора. Результат также не оправдал ожидания, так как рынок быстро подстраивается и индикаторы теряют предсказательную способность.

В нашем случае поиск правильной формулировки задачи оказался важнейшей частью решения, и мы пришли к поиску компаний с высокой вероятностью умеренного роста в краткосрочной перспективе.

Мы собрали информацию по более чем 4000 компаниям с 2000 года и натренировали алгоритм, который мог бы с хорошей точностью находить такие события. На тестовых данных медианы доходности наших моделей составили 2,7-4,1% за 2-3 недели, в течение которых открыта позиция. Это не означает, что модель позволяет удвоить капитал за год, но может улучшить результативность и диверсификацию стандартного портфеля.

Насколько можно доверять историческим результатам?

— Это самый критичный вопрос в нашей работе. Наивысший приоритет для нас – это правильная методика проверки на тестовых данных (бэктест). Лучше иметь более скромные, но честные результаты и быть в них уверенным, чем из-за неправильной методологии думать, что всё работает. А это – самая частая ошибка в алгоритмической торговле и даже в научных работах.

К примеру, очень распространенный изъян – это тестирование на тренировочных данных. То есть модель находит лучшие закономерности на тренировочных данных и, конечно же, там результат будет великолепным. Но это совсем не означает, что так же будет и в будущем. Можно также отметить менее очевидную «систематическую ошибку выжившего». К примеру, текущие члены индекса S&P 500 не всегда были в индексе и не факт, что в нем останутся. Делать тестирование только на этих компаниях – значит, заранее знать, кто будет входить в крупнейшие 500 предприятий США. Такие мелочи тоже могут повлиять на достоверность результатов.

Честно говоря, мы куда больше времени посвятили качеству теста, чем оптимизации алгоритма. Благодаря этому мы можем доверять нашим тестам и применять модель на практике. Мы уже закрыли 12 реальных сделок, которые в среднем принесли 3,5% – несмотря на отрицательную динамику рынков в последние недели.

 

Есть ли у вас конкуренты в этом деле?

В Казахстане мы – единственная управляющая компания, которая уже управляет активами с помощью машинного обучения. На это есть немало причин: и излишний скептицизм, и непонимание аналитики данных, и нехватка подходящих кадров. Мы сами видим для себя конкурентов вне Казахстана, например, «квант»-хедж-фонды. Но и перед ними у нас есть преимущество – активы наших инвесторов не находятся на одном счету в офшорах. У каждого нашего клиента свой отдельный брокерский счет, открытый в крупнейших банках США.

Какие у вас планы на будущее?

— У нас уже есть две инвестиционные стратегии с разным уровнем риска. Обе показывают хороший результат в этом году (+34,54% и +20,6% по более и менее агрессивной стратегии), потому что мы защитились от коронакризиса и вовремя зашли обратно в рынок. Небольшая доля активов уже инвестируется по прогнозам модели, и мы планируем запустить еще одну стратегию уже с фокусом именно на машинное обучение.