Как выбрать между данными, моделью или программным решением

Большинство людей не знают, когда использовать модель машинного обучения вместо традиционного программного решения.

Это 8-шаговое руководство позволит вам выбрать правильное решение для вашей проблемы.

1/ Можете ли вы написать программу с явными правилами

Инженеры-программисты пишут в своем коде точные правила, которые может выполнить компьютер. Специалисты по данным собирают входные данные и указывают желаемое целевое значение, а затем выбирают лучшую модель, которая прогнозирует оптимальное значение для каждого параметра для достижения желаемого целевого значения.

2/Должно ли программное обеспечение адаптироваться к регулярным изменениям в среде

Логика алгоритмов машинного обучения основана на поиске шаблонов в данных. Если данные изменяются, точность модели будет меняться, и поэтому мы ожидаем, что она будет постоянно меняться. Принимая во внимание, что разработка программного обеспечения обычно придерживается строгих правил для предоставления решения.

3/ Нужно ли это персонализировать?

Иногда слишком сложно найти закономерности в данных, чтобы люди могли создать индивидуальное решение, поэтому мы используем машинное обучение.

4/ Есть ли у нас время для экспериментов, если решение не сработает сразу?

ML — это более итеративный и экспериментальный процесс по сравнению с разработкой программного обеспечения. Иногда мы не можем создать работающее решение ML, поэтому нам нужно чувствовать себя комфортно, зная, что оно может не работать, если это нежизнеспособный вариант, то ML — не путь.

5/ Достаточно ли у вас исходных данных? Получить больше данных? Можем ли мы получить больше данных?

Вам нужен большой набор данных о типичных случаях, чтобы изучать правила на основе данных. Если у нас недостаточно или качество отсутствует (например, оно не помечено желаемым результатом), то мы должны получить больше, если это возможно.

6/Знаем ли мы желаемое целевое значение?

Как упоминалось ранее, необходимо указать целевое значение для сравнения прогноза с моделью, которая учится адаптировать параметры, чтобы приблизить прогноз к целевому значению.

7/ Есть ли в данных много типичных случаев, которые мы можем использовать для обучения модели?

Если у нас есть примеры типичных случаев в данных, то модель должна быть в состоянии идентифицировать систему, которую можно использовать для точных прогнозов.

8/ Есть ли закономерности в данных

В случаях, когда мы не знаем целевого значения, если в данных есть шаблоны, мы можем использовать разные альты для кластеризации данных в значимые группы.

Как выбрать между данными, моделью или программным решением

Вопросы по теме