Сегодня интеллектуальные технологии могут принести одинаковые улучшения всем заинтересованным сторонам, участвующим в обычных сделках B2C. Инновации органично вписываются в наши повседневные процессы: от бизнеса до семейных традиций. А иногда это может даже решить конфликты между работой и семьей.

Удивлен? Позвольте мне рассказать вам об одном из наших примеров использования Computer Vision и о том, как мы помогли сохранить праздник и бизнес-идею нашего клиента.

Однажды, перед Рождеством

Вам, наверное, знакома классическая предпраздничная ситуация: вы перегружены стратегическими дедлайнами в конце года, а домочадцы просят вас выбрать елочные украшения, чтобы произвести впечатление на соседей и друзей.

Нужно успеть закончить важные деловые дела, заказать праздничную гирлянду, купить подарки, и к Рождеству чувствуешь себя подогретым омлетом. И розничные торговцы, обслуживающие огромный поток эльфов Санты, тоже.

Современные проблемы требуют современных решений; это правда. Когда мы знакомимся с Reegeel, у них точно есть один на базе Computer Vision. Только представьте: вы загружаете в систему фото своего дома и получаете готовый план освещения с указанием типа и количества необходимых светильников и световых гирлянд. Звучит здорово.

Тем не менее, наши клиенты не могли добиться точных результатов работы системы и предоставлять ценные услуги своим клиентам в течение длительного времени. В чем дело? Давай выясним.

Соревнование

Как мы уже говорили ранее, у Reegeel есть идея упростить планирование наружного освещения для своих клиентов. Таким образом они хотели оптимизировать процесс проектирования за счет сокращения усилий команды и расчетного времени на каждый дизайн-проект.

Они разработали для своих пользователей сервис по автоматическому формированию планов наружного освещения зданий на базе Компьютерного зрения: не только для праздничного освещения, но и для всех видов наружного освещения. Благодаря этому их пользователи могут загрузить в систему фото своего дома, получить разные варианты освещения, выбрать понравившийся, затем оплатить и ждать свой заказ.

Когда Reegeel пришел к нам, они уже работали с двумя командами разработчиков программного обеспечения, но все еще не были удовлетворены точностью результатов алгоритмов. Они попросили нас проанализировать существующее решение и разработать предложения по улучшению.

Решение

Мы начали с анализа текущего решения, чтобы понять, почему алгоритм дает неточные результаты. У нас было несколько гипотез, и основной была проблема с качеством исходных данных, используемых для создания датасета и обучения модели.

Одной из основных задач, которую решала модель, была сегментация изображения. Набор данных был создан на основе изображений зданий, находящихся в свободном доступе в Интернете, и разбит на 11 классов. Классы включали стены, крыши, растения, подъездные пути и так далее.

Согласно предоставленной документации, точность по оценке IOU (стандартная метрика, используемая для оценки сегментации данных) колебалась от 50% до 82% в зависимости от класса. Далеко не лучший результат.

Мы проанализировали примерно 5% случайно выбранных фотографий из набора данных, предоставленного заказчиком. В ходе анализа мы выявили следующие проблемы с данными, используемыми для обучения модели:

  • Низкое разрешение фото (менее 1024 px по меньшей стороне);
  • Отсутствие единых правил маркировки (например, где-то отмечены дома на заднем плане, где-то нет). Есть ли дискриминация в сфере недвижимости?
  • Синтаксические ошибки (например, стена обозначена как дорога);
  • Фото сделаны в основном в США (там архитектура имеет свою специфику);
  • Снега в наборе данных не было! Все фотографии были сделаны в основном летом, но какое Рождество без снеговика?
  • Низкое качество маски.

Очевидно, что результат сегментации можно значительно улучшить за счет более качественной подготовки обучающих данных. Для этого наша команда разработала план действий, необходимых для создания качественного датасета и повторного обучения модели:

  1. Определите целевую группу изображений, которые будут максимально похожи на изображения клиента и будут иметь различный контекст — время года, ракурс, тип архитектуры. Собрать их в тестовый датасет в количестве около 100 штук;
  2. На основе тестового набора данных определить основные характеристики данных, на основе которых следует разработать обучающий набор данных;
  3. Разработайте правила маркировки данных и определите качество детализации (Качество детализации влияет на скорость маркировки и окончательные значения показателя IOU. То есть для значений 80 % , можно делать разметку быстрее и менее эффективно, при значениях ближе к 90% качество разметки должно быть выше);
  4. Сформируйте и пометьте набор данных, чтобы еще раз обучить модель.

По нашему опыту, для получения точности результатов IOU более 80% для всех 11 классов нам необходимо от 3500 до 5000 хорошо размеченных изображений. Для обеспечения высочайшего качества вывода всего решения мы подготовили автоматический скрипт для проверки точности и протестировали его на эталонном наборе данных из 100 качественно размеченных изображений.

Теперь клиент может использовать сценарий для предотвращения снижения производительности решения. Наши архитекторы решений также проанализировали текущий код и вместе с командой составили подробную дорожную карту дальнейшего развития проекта для получения максимального результата при минимальных затратах.

Успешно пройденная фаза Discovery уже принесла пользу, снизила риски и стала отличной основой для будущего развития проекта клиента.

Ваш бизнес заслуживает инноваций

Независимо от того, продаете ли вы наружное освещение или запускаете комплексное производство швейного оборудования, вы можете перенять современные технологии для своего бизнеса. Внедрение инноваций в ваши повседневные бизнес-процессы помогает сосредоточиться на основных целях, оптимизировать ресурсы и сохранять конкурентоспособность на рынке.

Если вы боитесь сделать убыточные инвестиции, мы можем помочь вам проверить ваше конкретное экономическое обоснование. Свяжитесь с нами, чтобы получить профессиональные консультационные услуги от наших специалистов, или посетите страницу Computer Vision, чтобы узнать больше.