В предыдущем посте мы обсуждали, как я черпал вдохновение из мастер-класса Strategyzer для создания канвы модели ML/AI. Я создал это полотно, чтобы удовлетворить потребности рынка, чтобы помочь специалистам по данным и специалистам-практикам лучше доносить свои проекты до бизнес-аудитории и запускать более успешные проекты ИИ.

Если вы еще этого не сделали, прочитайте мой первый пост об основах этого холста здесь ML/AI Model Canvas.

Этот пост представляет собой тематическое исследование того, как вы можете использовать холст модели ML/AI для гипотетического проекта обнаружения и транскрипции объектов.

Фиктивная компания A-Corp и проблема

Представьте на мгновение, что у нас есть вымышленная компания под названием A-Corp, компания по производству мебели, которая пытается решить проблему неэффективности способов получения сырья от поставщиков.

Когда товар доставляется поставщиком на приемный док, сотрудник использует буфер обмена и бумажный шаблон, чтобы записать ключевые сведения об элементе. К ним относятся:

  • Номер предмета
  • Имя элемента
  • Цвет товара
  • Наименование поставщика
  • Количество
  • и т.д…

Позже этот шаблон вводится в систему планирования ресурсов предприятия (ERP) для отслеживания запасов. Предположим также, что компания не смогла использовать систему штрих-кодов или код продукта для ввода товаров в систему ERP. Это очень похоже на реальный проект, над которым я работал в прошлом, за исключением того, что все ссылки на людей, отрасли и саму проблему были полностью изменены по соображениям конфиденциальности.

Предложенное решение

Что им нужно, так это система, которая может работать на портативном устройстве, таком как мобильный телефон, которая может делать фотографии, сканировать текст и автоматически помещать каждую текстовую строку в нужное поле и отправлять ее в ERP.

Это вообще возможно?

Да, это канва ML/AI, в которой показано, как этого можно достичь.

Факторы, которые следует учитывать

  • Существует множество различных этикеток от разных поставщиков, которые не могут быть известны в начале проекта и могут быть изменены без предварительного уведомления.
  • Текст не всегда имеет предшествующее имя поля, например. «Поставщик: ACME Corp», «Серийный номер: A29008529» и т. д., которые можно использовать в качестве идентификаторов.
  • Двойная обработка данных происходит через ввод данных человеком.
  • Запись записей вручную занимает много времени и подвержена ошибкам.

Вспомним холст модели ML/AI, о котором мы говорили в последнем посте ниже. Мы собираемся заполнить это для этого гипотетического проекта.

Скачать шаблон холста модели ML/AI

Известная информация

Начните с заполнения всей известной информации о проекте.

Движущие факторы бизнеса:

  1. Ошибки повторного заказа обходятся компании в 100 тысяч долларов в месяц в виде сырья.
  2. Для выполнения этой задачи требуется один сотрудник с полной занятостью (FTE), 1 день в неделю, поэтому любое снижение эффективности поможет этому сотруднику высвободить время для выполнения более значимой работы.
  3. В настоящее время нет возможности поиска в ручном методе буфера обмена, кроме пролистывания листов, чтобы убедиться, что вы записали каждый элемент.

Цель:

Чтобы уменьшить количество ошибок транскрипции, уменьшить количество переделок и повысить эффективность.

Текущая команда:

Включает веб-разработчиков, которых можно было бы привлечь для обслуживания новой системы, и сотрудников по закупкам, которые в настоящее время выполняют эту задачу вручную. Это может представлять риск для проекта во время передачи, поскольку в команде нет никого, кто разбирается в приложениях ML. Это означает, что либо проекту потребуется более тщательная передача, включающая обучение моделям машинного обучения и постоянную поддержку, либо компания может рассмотреть вопрос о найме нового члена команды, если у них есть больше проектов машинного обучения в их дорожной карте продукта.

Вмешательство:

Предлагаемое решение представляет собой систему камер, которая может распознавать текст с любой этикетки и вводить его в систему ERP.

Неизвестная информация

Тип данных/размер/скорость

После разговора с руководителем производства мы узнали, что они думали о реализации подобного проекта в течение нескольких месяцев и накопили запас этикеток на 1 месяц (около 200 изображений). Вся эта информация является данными о продукте и общедоступна, поэтому не нужно беспокоиться о личной информации. Кроме того, каждую неделю создается 50 новых изображений, которые необходимо проанализировать и правильно идентифицировать перед вводом в ERP.

Приемлемая точность и компромиссы

Оглядываясь назад на журналы обновлений в системе ERP, мы видим, что около 30% элементов, введенных вручную, должны были быть обновлены, чтобы отразить правильные элементы и количество. Это наводит нас на мысль, что люди примерно на 70% точны в правильности всех деталей этикетки с первой попытки. Это базовый уровень, который мы должны превзойти с помощью нашего алгоритма.

Вверх и вниз по течению

Данные для этого NLP/алгоритма классификации будут поступать из изображений, отправленных из мобильного приложения, которые могут иметь разное качество и освещение из-за того, что приложение работает на разных типах телефонов и в разных условиях освещения в зависимости от дня и местоположения на складе. .

Конечным пунктом назначения этих данных является система ERP, которая отслеживает все сырье и заказы в процессе производства. Обычные ERP-системы поставляются крупными производителями программного обеспечения в отрасли, включая SAP, Oracle и Microsoft, и могут быть интегрированы с помощью различных методов и соединителей. Для этого примера предположим, что мы будем интегрироваться с системой самым простым способом, который обычно заключается в экспорте CSV-файла из одного приложения и его приеме нижестоящим приложением по определенному расписанию. Это не самая надежная интеграция, и ее не следует использовать для производства, но этого будет достаточно, чтобы доказать, что система будет работать, прежде чем будут вложены большие объемы времени и денег для создания или покупки пользовательской интеграции.

Инфраструктура

Этот клиент уже использовал AWS для размещения других приложений в своей инфраструктуре, поэтому мы будем использовать поставщика облачных услуг, в администрировании которого у клиента есть опыт, чтобы снизить эксплуатационные расходы и расходы на обслуживание.

Есть много способов настроить подобный проект на AWS, включая использование функций Lambda, которые реагируют на вызов API, SageMaker, который позволит вам запускать алгоритмы машинного обучения и быстро создавать конечные точки, и в этом случае из-за Благодаря знакомству клиента с ECS и Docker мы решили выделить для этой задачи небольшой экземпляр, который можно было бы увеличивать и уменьшать по мере необходимости в зависимости от нагрузки.

В качестве языка для этого проекта был выбран Python, но его можно было бы в равной степени реализовать и на другом языке JavaScript с Node или даже Scala, учитывая преобладание библиотек машинного обучения/компьютерного зрения во многих наиболее популярных языках.

Тип модели

В этом проекте AWS Textract использовался для извлечения текста из изображений, AWS Comprehend использовался для извлечения тегов частей речи и извлечения сущностей. Эти точки данных были переданы в CNN для классификации текста, чтобы определить:

  1. Если текст был полезен; и
  2. С каким полем ERP оно было связано.

Хотя технический аспект этого проекта не находится в центре внимания этого поста, некоторые примеры кода Python, которые помогут вам начать работу, можно найти здесь. Вам понадобится Аккаунт AWS, AWS CLI и Python ≥3.5, установленный на вашем ноутбуке. Для простой установки Python используйте Anaconda.

Вывод

Теперь, когда у нас есть полностью заполненный холст, пришло время представить этот проект ключевым лицам, принимающим решения. Я часто использую презентацию Powerpoint, чтобы пройтись по основным точкам холста, как мы сделали в этом посте. Это должно сопровождаться сметой проекта, графиком и оценкой ценности, создаваемой проектом, будь то время, сэкономленное сотрудниками, удержание клиентов или что-то еще. Эти результаты помогут лицам, принимающим решения, понять необходимые инвестиции, затраченное время и окупаемость инвестиций для проекта, а также подход.

На этом мы подошли к концу первого тематического исследования ML/AI Model Canvas. Теперь идите туда и начните планировать свои проекты машинного обучения и проведите презентацию!

Если вам понравилась эта статья и вы хотите больше подобных, пожалуйста, ставьте хлопки ниже!