Часть 1: Определение проблемы

Если вы заинтересованы в использовании машинного обучения (ML) для улучшения существующего продукта в реальном мире, важно понимать, как разработка ИИ работает в жизненном цикле и контексте проекта разработки программного обеспечения. Согласно недавнему исследованию Gartner, ведущие организации имеют в среднем четыре проекта ИИ на стадии разработки, и, по прогнозам, в течение следующего года это число удвоится. Искусственный интеллект - это, пожалуй, самая преобразующая технология, доступная сегодня.

На высоком уровне каждый проект разработки ИИ следует этим шести шагам:

1) Определение проблемы

2) Сбор данных

3) Определение функции

4) Построение модели AI

5) Оценка и уточнения

6) Развертывание

В этой статье я поделюсь лучшими практиками для первого шага: определения проблемы.

Правильное определение и характеристика проблемы, решаемой с помощью ИИ, часто более важны, чем выбор самого алгоритма. Это может сэкономить вам массу работы в дальнейшем, не допуская решения неправильной проблемы.

Для того чтобы ИИ мог делать прогнозы, не обязательно, чтобы закономерность в данных была немедленно воспринята людьми, но закономерность должна быть.

ИИ или не ИИ?

Начните формулировать проблему с простого, но критически важного вопроса: есть ли шаблон? Предпосылка, лежащая в основе всех дисциплин машинного обучения, заключается в том, что должен быть шаблон. Если нет закономерности, то проблему невозможно решить с помощью технологии ИИ. Очень важно, что этот вопрос задают до того, как вы решите отправиться в путь разработки ИИ.

Внешне ML работает так же, как человеческий мозг. Решения, которые мы принимаем каждую минуту каждого дня, основаны на непрерывном распознавании образов. Когда мы сталкиваемся со сценарием, который не идентичен сценарию, который мы испытывали ранее, - скажем, с уникальной конфигурацией дороги на перекрестке во время вождения, - мы можем без труда определить, какой должна быть идеальная реакция. Это связано с ментальной моделью, которую мозг разработал - и продолжает развиваться - с учетом сотен тысяч точек данных и обработкой благодаря нашей врожденной способности распознавать закономерности на подсознательном уровне.

ML представляет собой математическое приближение этой стратегии, применяемой к цифровому миру.

Для того чтобы ИИ мог делать прогнозы, не обязательно, чтобы закономерность в данных была немедленно воспринята людьми, но шаблон действительно должен быть.

Что это за проблема с ИИ?

Если предполагается, что в данных есть закономерность, можно использовать методы разработки ИИ.

Прикладное использование этих методов обычно ориентировано на ответы на пять типов вопросов, каждый из которых может быть отнесен к категории предиктивного анализа:

1) Какая категория? (Классификация)

2) Сколько или сколько? (Регрессия)

3) Какая группа? (кластеризация)

4) Это необычно? (Обнаружение аномалии)

5) Какой вариант следует выбрать? (Рекомендация)

Важно определить, какие из этих вопросов вы задаете и как ответы на них помогают достичь ваших бизнес-целей.

Упростите вашу проблему

Иногда целевая метрика, которую вы хотели бы спрогнозировать, не может быть напрямую измерена количественно. Например, предположим, вы хотите спрогнозировать уровень удовольствия клиента во время его взаимодействия с вашим веб-сайтом. Удовольствие сложно определить и смоделировать, поэтому нам нужно копаться в данных, чтобы определить, есть ли более простые задачи, которые могут действовать как хорошие прокси. Другими словами: какие задачи соотносятся с получением удовольствия? Часто хороший подход состоит в том, чтобы попытаться найти промежуточные события, которые влияют на желаемый конечный результат, но использовать события, которые более четко определены и, следовательно, легче моделируются. В примере с удовольствием мы могли бы захотеть использовать «общее время, которое клиенты проводят на веб-сайте в неделю» в качестве показателя удовольствия.

Тщательно подумайте о том, что на самом деле является правильной задачей машинного обучения для вашего проекта разработки ИИ. Это может показаться очевидным, но на самом деле это может быть удивительно беспорядочно. Неспособность правильно определить проблему может стоить вам огромного количества времени и денег.

Ссылка