Будущее корпоративного поиска

В этом посте мы рассмотрим мотивацию и видение нового продукта Caption, а также набросаем дорожную карту.

Поиск должен был стать решенной проблемой, верно? На этом этапе основные алгоритмы существуют уже несколько десятилетий. Мало того, что Google произвел революцию в сфере обслуживания потребителей во всем мире, но и корпоративные игроки, такие как Elastic, Algolia и многие другие, упростили для компаний любого размера, от гигантов из списка Fortune 500 до гибких стартапов, беспрепятственную индексацию и поиск своих файлов. . В чем же тогда загвоздка?

Мотивация и возможность

Основная проблема заключается в текстовой природе основных участников поисковой системы предприятия. Они были разработаны с учетом текстовых документов как основного типа контента на предприятиях. Хотя они хорошо работают с предполагаемыми типами документов, они оставляют без обработки большие объемы содержимого.

Аудио и видео файлы - самые яркие примеры. В настоящее время нет простого готового способа индексировать файлы и делать их доступными для поиска. От видео на Coursera и подкастов до внутренних обучающих видео во время моего пребывания в Amazon - никогда не было способа найти моменты, когда встречаются фразы и ключевые слова, что доставляло бы много неудобств. Заголовок призван заполнить эту пустоту.

Подпись

Caption - это продукт SaaS, позволяющий пользователям загружать, индексировать, расшифровывать и искать свои аудио- и видеофайлы. Он состоит из двух частей: простой в использовании приборной панели, с помощью которой можно выполнять операции, а также API, который позволяет пользователям интегрировать поиск аудио / видео в свои собственные приложения. Чтобы лучше понять, как это работает, посмотрите обучающие видео, которые мы создали.

Функция блокчейна находит в ваших файлах отметки времени, где встречается определенное ключевое слово. Все это стало возможным благодаря огромным достижениям в области машинного обучения, которые упрощают транскрипцию, извлечение ключевых слов и подобные операции. В настоящее время субтитры поддерживают двадцать шесть языков с оговоркой, что качество несколько варьируется между основными и менее частыми.

Случаи применения

Существует множество вариантов использования поиска по аудио и видео, но здесь мы выделим некоторые из наиболее известных.

  • СМИ: организации СМИ и вещательные компании имеют огромное количество аудио- и видеоматериалов. Их редакторы и продюсеры часто испытывают затруднения при извлечении информации из старых записей и вынуждены искать только в метаданных.
  • Онлайн-образование. Программное обеспечение для поиска аудио и видео идеально подходит для платформ онлайн-образования. Их образовательные видеоролики имеют высокую плотность информации, и предоставление студентам возможности найти точные моменты, когда раскрывается определенная концепция, имеет огромное значение.
  • Подкасты. За последние несколько лет популярность подкастов резко возросла. И тем не менее, существует не только изобилие подкастов как таковых, но и эпизоды длинные и часто вольные. Следовательно, организация данных и предоставление пользователям возможности находить моменты, которые им интересны больше всего, являются ключевыми.

Дорога впереди

Демонстрационная версия и прототип Caption, которые мы до сих пор распространяли в частном порядке, вызвали огромный энтузиазм, особенно в СМИ и вертикали онлайн-образования. Это убедило нас удвоить производство продукта и донести наше видение до клиентов по всему миру. У нас есть несколько основных пунктов в дорожной карте.

  • Продукт SaaS. Мы будем разрабатывать наш продукт SaaS, состоящий из вышеупомянутой панели инструментов и API. Мы добавим поддержку большего количества языков; поддержка более сложных запросов, таких как получение похожих видео / аудиозаписей; извлечение ключевых слов; и другие варианты загрузки.
  • Локальное развертывание. Хотя мы верим, что будущее за облаком, мы знаем, что клиенты во многих отраслях еще не совсем готовы к этому скачку. Таким образом, мы будем предоставлять локальные развертывания с различными вариантами загрузки и позволять клиентам подключать столько собственных компонентов, сколько они пожелают, а также функции безопасности корпоративного уровня.
  • Совершенно секретный проект. В ближайшие недели мы запустим вспомогательный продукт, который продемонстрирует нашу технологию. И я верю, что всем это будет интересно. Намеков пока нет, но следите за обновлениями. 🙃

В любом случае спасибо, что следуете за путешествием. Не стесняйтесь подписаться на нас в LinkedIn, зарегистрироваться на сайте или написать нам электронное письмо.

Марин - соучредитель и генеральный директор Caption. Ранее он был основателем QuickNews, новостного приложения на основе машинного обучения, а ранее работал инженером-программистом в Amazon, где работал над S3 и Alexa.