Когда дело доходит до новых методов извлечения данных из текста в документах, финансовая отрасль, в частности, действительно расширяет границы возможного. Десятилетиями банкиры, управляющие фондами, аналитики и специалисты по инвестициям стремились к альфе, находя новые способы количественной оценки окружающего нас мира. Почему это? Если аналитик хедж-фонда обнаруживает значимую корреляцию и причинно-следственную связь между типом инвестиций и новым набором данных, по сравнению, например, с корпоративной исследовательской группой, между развертыванием этой модели и получением денежной выгоды проходит очень мало времени и пространства. Однако как только этот новый подход к аналитике становится широко распространенным, способность генерировать доход быстро исчезает. Именно это делает банковский и инвестиционный секторы такими уникальными в их неустанных инновациях.

В то время как большинство традиционных подходов к науке о данных в 2020 году были исследованы много раз, область НЛП по-прежнему содержит много возможностей для действительно новых и ценных исследований. Дело в том, что банки, университеты, компании, правительства и платформы социальных сетей всех форм и размеров создали миллиарды документов, содержащих ценную информацию в виде исследовательских отчетов, технических документов, финансовых документов, юридических документов и т. д. . Еще многое предстоит открыть, и есть много инновационных компаний, производящих новые системы для сбора этих данных. Вот несколько примеров для изучения и открытия;

SENTIEO, Стартап по поиску документов

В 2011 году соучредитель и генеральный директор Sentieo Алап Шах покинул Citadel с намерением использовать возможности НЛП и технологии машинного чтения, чтобы значительно повысить скорость и точность поиска в финансовых документах, отчетах о доходах и презентациях компаний. Используя анализ настроений, умные функции поиска синонимов и современные методы баз данных, им удалось вырасти в одну из двух поисковых систем для документов уровня институциональных инвесторов, доступных сегодня на рынке.

МОНЕТА, JP Morgan Chase

В 2017 году JP Morgan Chase запустил новую платформу под названием Contract Intelligence (COIN), программное обеспечение для машинного обучения, которое, как они утверждают, сотрудники юридического отдела банка могут загружать контракты для извлечения важных точек данных и положений, которые могут ускорить их работу. Юридическая команда банка каждый год тратила около 360 000 часов на ручную проверку договоров коммерческого кредита перед развертыванием системы.

KENSHO, дочерняя компания глубокого обучения S&P Global

S&P Global приобрела стартап Kensho в области искусственного интеллекта еще в 2017 году. Фирма использует NLP в механизме классификации и обработки текста. В режиме реального времени система Kensho NLP автоматически назначает темы и темы для входящих новостных статей и предоставляет услуги наблюдения крупным клиентам, включая Goldman Sachs и JP Morgan. Исследователи данных Kensho также работают над применением архитектуры нейронной сети для определения оценок настроений в новостных статьях, в которых упоминаются конкретные компании.

KASISTO, чат-бот банковского обслуживания клиентов

Компания Kasisto, основанная в 2015 году, предлагает чат-бот под названием KAI, который может помочь банкам и финансовым учреждениям разработать чат-ботов, которые помогают клиентам совершать платежи, получать транзакции и данные счета, а также управлять своими финансами с помощью генерации текста NLP. Они также разрабатывают дочернее приложение KAI Business Banking, которое представляет собой программное обеспечение, специально предназначенное для банков, и включает в себя инструмент аналитики с глубоким обучением, который может помочь в сборе и анализе данных, обучении моделей, тестировании и развертывании.

PERISCOPE CAPITAL, Инновационный хедж-фонд

Periscope Capital, хедж-фонд среднего размера из Торонто, был в авангарде НЛП и анализа настроений. Используя нейронную сеть, Periscope создала систему, которая мгновенно предоставляет оценку тональности всякий раз, когда твит, комментарий, новостная статья, сообщение в блоге или стенограмма звонка попадает в их базу данных. Затем просмотры и оценки настроений объединяются, чтобы создать широкие возможности отслеживания настроений рынка.

Есть еще много примеров компаний, использующих или разрабатывающих платформы NLP для помощи в инвестиционной стратегии и финансовых операциях, но потенциальная польза от количественной оценки текста огромна почти во всех уголках мира финансов.