Цель этой статьи — пролить свет на варианты получения дохода, которые возможны в модном слове машинного обучения. В то время как машинное обучение позиционируется как панацея от всех проблем, с которыми сталкивается ИТ-индустрия, реальность такова, что готовность и внедрение машинного обучения — это путешествие, требующее серьезной модернизации многих операций организации. Возможности, открывающиеся на этом пути, значительны и могут стать новым источником дохода для любых известных поставщиков ИТ-услуг и/или стартапов. Этот документ призван пролить свет на некоторые из этих областей и задуман как отправная точка в описании ландшафта формирования доходов.

Жизненный цикл проектов видеоаналитики

Любой проект видеоаналитики обычно проходит следующие этапы. Это отдельные этапы в каждом проекте, и, как правило, для успешного завершения каждого этапа требуются совершенно разные навыки. Хотя некоторое ускорение возможно, эти этапы, как правило, являются последовательными и не сильно перекрываются.

  • Сбор данных и аннотация
  • Архитектура модели и обучение
  • Предварительная обработка данных
  • Вывод
  • Постобработка

Жизненный цикл проекта

На первый взгляд жизненный цикл проекта Video Analytics похож на модель SDLC Waterfall. Однако эта модель имеет значительное сходство с моделью CRISP-DM, предложенной и опубликованной IBM. Такие этапы, как маркировка и аннотация, характерные для видеоаналитики, добавлены в соответствующие места. Модель сама по себе не сопоставима с Agile-моделью разработки программного обеспечения. Тем не менее Agile-машинное обучение является интригующей концепцией и требует собственного глубокого понимания. (Агентство, 2017)

Бизнес-требования

Это первый шаг в проекте. Именно здесь идентифицируется вся информация, такая как рабочие параметры программного обеспечения для видеоаналитики. Это включает в себя, помимо прочего, программную среду, требования к оборудованию, качество видеопотоков, условия освещения, видимый/инфракрасный спектр, камеры для измерения глубины, окклюзии и т. д. Эти требования учитываются на последующих этапах и имеют решающее значение для определения успех или неудача проекта. Перед переходом к последующим этапам жизненного цикла рекомендуется в максимально возможной степени зафиксировать бизнес-требования.

Сбор данных и аннотация

Этот этап содержит сбор данных, необходимых для бизнес-задачи при изменении. Сбор данных может осуществляться многими способами. Либо данные являются общими, и наборы данных могут быть сгенерированы из общедоступных мест (например, видео о дорожном движении, данные о толпе и т. д.), либо могут быть специфическими и специфичными для отдельных компаний, например, данные производственной сборочной линии и т. д. После сбора данных существует неизбежное требование аннотировать данные. Все известные модели машинного обучения требуют, чтобы данные видео/изображения были аннотированы, чтобы ученые/исследователи в области компьютерного зрения, которые разрабатывают модели, могли передавать соответствующие данные в свои модели. Давно известно, что для любой системы это мусор-в-мусор-выход. Аннотация данных является точкой, где формулируется часть «Вход», этот этап невероятно важен и требует особого внимания к качеству. Существующие методы сбора и аннотирования данных требуют большого количества ручных усилий и специальных знаний. Эти знания непросто получить самостоятельно, и организации, инвестирующие в видеоаналитику, получат значительную выгоду от аутсорсинга на этом этапе.

Архитектура модели и обучение

Этот этап является «секретным соусом», который в конечном итоге определяет успех или провал проекта видеоаналитики. Этот этап включает в себя принятие решения о том, использовать ли готовую модель или создавать модель с нуля. На это решение влияют различные микро- и макрофакторы, а именно: Коммерческая доступность требуемой модели, применимость к бизнес-задаче, жизнеспособность бизнеса, необходимость решения, защищенного интеллектуальной собственностью, и т. д. Некоторые из ключевых факторов, влияющих на это решение:

  • Наличие модели. Модель, необходимая для решения конкретной проблемы компании, может быть недоступна в готовом виде. Многие модели, доступные в открытом доступе, слишком поверхностны и крайне ограничены конкретным набором данных, на котором они обучались. Они никоим образом не являются универсальными моделями и требуют серьезного проектирования. Подход «переносного обучения» может не всегда соответствовать требованиям, и необходимо соблюдать осторожность при оценке «соответствия» таких моделей.
  • Защита интеллектуальной собственности: модель может быть доступна в другой компании, и в этом случае решающим фактором при принятии решения становится вопрос «производить или покупать». Как «сделать», так и «купить» сопряжены со своими проблемами. В случае «покупки» крайне важно обеспечить достаточную IP-защиту решения для сохранения преимущества.
  • Жизнеспособность бизнеса. Если решение состоит в том, чтобы «создать» модель собственными силами, очень важно убедиться, что внутренние ресурсы должным образом оснащены для решения этой задачи. Это включает в себя не только знания в области программирования и вычислительные ресурсы, но и глубокие знания предметной области, начиная с CNN и заканчивая последними достижениями технологий, связанных с видеоаналитикой. Для компаний крайне важно заранее знать, что на этом этапе происходит много действий «высокий риск — высокая доходность». Этот этап предполагает работу со специальными знаниями, которые по состоянию на 2019 год сложно получить на рынке. Кроме того, даже при наличии хороших ресурсов нельзя гарантировать результат.

Предварительная обработка данных

Этот этап включает в себя обработку видеопотоков перед их вводом в модель. Хотя это указано как отдельный этап, важно отметить, что этап предварительной обработки данных идет рука об руку с этапами построения модели и вывода. Предварительная обработка данных берет на себя ответственность за преобразование реальных данных в формат, который лучше всего подходит для разработанной модели. Примерами этого могут быть простые преобразования формата или преобразования кодеков в сложные алгоритмы обработки изображений, такие как применение фильтров, выполнение сверток и маскирование.

Вывод

На этом этапе теория встречается с реальным миром. С точки зрения программного обеспечения, вывод — это место, где модель запускается в производство. Архитекторная модель развертывается на оборудовании коммерческого класса и используется. Архитектура модели может быть выполнена в лаборатории с лучшими в своем классе вычислительными ресурсами. Затраты здесь обычно попадают в категорию капитальных затрат. Вывод, однако, как правило, является операционными расходами, и у компаний есть веская причина желать меньшего присутствия здесь. Все основные производители ЦП расширяют линейки своих продуктов, предлагая специализированные механизмы логического вывода для самых разных ситуаций, таких как облачные, мобильные, SoC, FPGA, встроенные и т. д., чтобы помочь снизить показатели операционных расходов. Все эти системы и организации имеют свои собственные возможности, ограничения и, что более важно, собственные реализации. Фреймворки вроде Open-CL еще не созрели. Кроме того, маловероятно, что реализация на Open-CL сможет использовать все возможности каждой аппаратной платформы. В этом сценарии для организаций очень важно обладать ноу-хау по переносу модели на различные аппаратные платформы. Учитывая, что индустрия делает ставку на то, что Inference станет огромной возможностью для получения дохода, нельзя не отметить необходимость в игроках со специальными навыками на этом этапе.

Постобработка

Этот этап относительно наименее связан с внутренней работой технологий видеоаналитики. Этот этап связан с построением бизнес-логики, связанной с обработкой данных, извлеченных из видео. Грубо говоря, можно утверждать, что целью видеоаналитики является количественная оценка информации в неструктурированных данных. Если мы придерживаемся этого аргумента, цель этапа постобработки состоит в том, чтобы использовать количественную информацию для извлечения информации из данных. Например, рассмотрим систему мониторинга трафика. Вывод может помочь в количественной оценке количества и типа транспортных средств, присутствующих на дороге. Постобработка может включать дополнительные алгоритмы машинного обучения для извлечения информации из этих данных, таких как плотность трафика, анализ времени ожидания светофора, определение скорости или обнаружение аварий. Большинство компаний-интеграторов ИТ-систем имеют все необходимое для того, чтобы справиться с этим этапом без особых усилий. Вообще говоря, они уже обладают ноу-хау для интеграции системы видеоаналитики в процессы организации.

Сноски

Хотя в этом документе предпринимается попытка обобщить и классифицировать действия в проекте видеоаналитики, следует подчеркнуть, что отдельные этапы требуют значительного количества рукопожатий. В отличие от жизненного цикла разработки программного обеспечения, где водопадная модель исключает внесение изменений в предыдущий этап, конвейер проекта видеоаналитики больше похож на CRISP-DM, где этапы имеют значительные переходы между собой. Есть много работ, в которых утверждается, что организации почти всегда лучше собирать более качественные данные, чем инвестировать в лучшие человеческие ресурсы для достижения лучшего результата [(Необоснованная эффективность данных)]. У этого аргумента есть как сторонники, так и противники. Эта газета не занимает никакой позиции ни в том, ни в другом случае. Вместо этого мы хотели бы заявить, что, независимо от вашего пристрастия, вышеупомянутые этапы неизбежны в проекте видеоаналитики. Ваш выбор аргументов повлияет на приоритет, который вы придаете каждому отдельному этапу.

Основа бизнес-модели

Business Model Canvas — это шаблон визуального управления, предложенный Александром Остервальдером для документирования и передачи бизнес-моделей организации (элементы бизнес-модели для системы продуктов и услуг). Он визуально описывает предложения организаций, ценностное предложение, клиентов и финансы.

Сбор данных и аннотация

Как видно из раздела целей, деловая активность в этой области, а именно. Сбор данных и аннотация изображений очень своеобразны. Сбор данных может быть таким же простым, как сбор данных о дорожном движении с помощью обычной веб-камеры, сбор сложных данных медицинской визуализации или данных, очень специфичных для отрасли, с использованием сложного оборудования. Аннотирование, будучи трудоемкой и низкоквалифицированной работой, требует значительных затрат, и компании, инвестирующие в интеллектуальную собственность для автоматизации этой деятельности, могут получить значительные выгоды.

По самой природе требований к аннотациям решения/услуги должны создавать несколько рабочих процессов, которые могут быть очень разнообразными. Характер работы здесь аналогичен BPO или KPO. (Аутсорсинг бизнес-процессов / Аутсорсинг процессов знаний). На рынке уже есть несколько решений, которые можно использовать для создания этих пользовательских рабочих процессов. AWS GroundTruth и Azure Knowledge Exploration Service — два самых популярных доступных решения.

Архитектура модели

Архитектура модели чрезвычайно ориентирована на ценность. Ценность решения с IP-защитой для моделей может стать отличительной чертой компаний, и, следовательно, предложение такого решения может существенно изменить правила игры для клиентов. Прекрасную параллель можно провести с фармацевтической промышленностью, где некоторые компании занимаются только исследованием новых лекарств и их патентованием. (Роль научно-исследовательской фармацевтической промышленности в медицинском прогрессе в Соединенных Штатах.)

Предварительная обработка данных

Организации, пытающиеся работать в этом пространстве, повышают ценность своих клиентов, обладая значительными знаниями о различных форматах данных, в которых сохраняются изображения/видео. Например, знания о форматах медицинских изображений существенно отличаются от спутниковых снимков. Владение «ноу-хау» для преобразования из одного формата в другой может быть большим преимуществом для команд по архитектуре модели.

Вывод

Многие компании предоставляют механизмы логического вывода, чтобы обеспечить оптимальную работу аналитических моделей. Примерами являются NVIDIA, OpenVINO от Intel, SNPE от Qualcomm и т. д. Для работы на этом этапе организациям необходимо иметь специальные знания о различных механизмах логического вывода, их конкретных возможностях и ограничениях, а также о компромиссах с точностью при переводе модели на конкретные платформы. Это должно быть тщательно проработанное суждение, чтобы гарантировать, что клиенты получат максимальную отдачу от своих денег.

Постобработка

После тщательного анализа характера работы в области постобработки автор считает, что бизнес-модель на этом этапе очень похожа на бизнес-модели системных интеграторов, которые уже усовершенствовали свое искусство. Следовательно, здесь не строится отдельная модель.

Постобработка требует много усилий по архитектуре. См. мою статью Архитектуры решений для проектов компьютерного зрения

использованная литература

  1. APB, B., VP, C., MG, O. и H., R. (2011). Элементы бизнес-модели для системы продуктов и услуг. Springer, Берлин, Хайдельберг.
  2. Агентство, Ю. (2017, 20 июня). Когда Agile встречается с машинным обучением. Получено с веб-сайтаwardsdatascience.com: https://towardsdatascience.com/when-agile-meets-machine-learning-2af111bddee
  3. Халеви, А., Норвиг, П., и Перейра, Ф. (2009). Необоснованная эффективность данных. Интеллектуальные системы IEEE, том 24, стр. 8–12
  4. Кайтин, К.И., Брайант, Н.Р., и Лазанья, Л. (1993). Роль научно-исследовательской фармацевтической промышленности в медицинском прогрессе в Соединенных Штатах. Журнал клинической фармакологии, 33, 412–417.

Что вы думаете? Пожалуйста, поделитесь своими мыслями на [email protected] и/или [email protected]