Независимо от того, какую задачу машинного обучения вы решаете, вам необходимо пройти следующие 4 шага:

Шаг 1: Данные

Примечание. Данные — это ключ к машинному обучению, а без данных не существует науки о данных.

Определение: Просто вещи, на которых мы учимся.

Как учиться: это длинная тема, но нам нужно быть осторожными с некоторыми моментами, такими как следующие:

а. Соберите данные из одного и того же распределения, чтобы обучить модель и протестировать модель машинного обучения.

б. Маркируйте данные с помощью экспертов, потому что «мусор на входе, мусор на выходе» означает, что если вы предоставите данные, полные ошибок, то вы обязательно получите ложные результаты.

в. Все примеры данных должны иметь одно и то же измерение, поскольку оно нам нужно для входных данных модели. Как и в случае с изображениями, большую часть времени мы обрезаем изображения или изменяем их размер; однако это зависит от проблемы, которую мы хотим решить. Изображения, полученные с помощью микроскопа, потеряют информацию, если мы обрежем их, а изменение их размера приведет к изменению формы объектов внутри изображений. Теперь очень важно найти лучшее решение для сохранения таких функций, как контраст, детализация краев, цвет и текстуры.

Шаг 2: Модель

Определение: просто как преобразовать данные в обучение для прогнозирования в соответствии с инструкциями, предоставленными людьми.

Прежде чем приступить к обучению модели и работе с миром, необходимо выявить природу проблемы. Вот следующие предложения:

а. Отметьте, какую проблему вы хотите решить. Это регрессия или классификация?

б. Проверьте литературу, чтобы узнать, были ли решены одни и те же проблемы с помощью моделей обучения с учителем (управляемых задачами), моделей обучения без учителя (управляемых данными) или моделей обучения с полуконтролем (небольшие метки в большой базе данных). Иногда вам нужно проверить обучение с подкреплением (обучение на ошибках), если проблема основана на оптимизации вознаграждения.

в. Выбирайте лучшие модели и проверяйте вычислительную сложность модели, потому что иногда мы выбираем лучшую модель, но из-за ограниченности ресурсов не сможем предоставить результаты в короткие сроки. Однако, если вас все еще интересуют большие модели, сначала выберите небольшой набор данных. Если модели работают с небольшими данными, возможно, можно будет работать и с большими данными.

Шаг 3: Целевая функция

Определение: просто параметры оценки, которые показывают нам, насколько хорошо или плохо работает модель. Разные задачи имеют разные параметры оценки, например, модель регрессии, определяемая квадратом ошибки, и задачи классификации, определяемые функциями потерь. Есть следующие вещи, которые нам необходимо знать как данность:

а. Данные обучения не гарантируют, что модель будет работать на невидимых данных. Нам нужно разделить данные на три части: данные обучения (наибольшее количество примеров), данные тестирования (используются для проверки недостаточного или переобучения) и данные проверки (используются для разработки).

б. Проверьте частоту ошибок и настройте различные параметры, такие как скорость обучения, размер пакета, данные, алгоритмы оптимизации и т. д., чтобы минимизировать потери.

Шаг 4: Алгоритмы оптимизации

Определение: Алгоритм, который корректирует параметры модели для минимизации потерь целевой функции.

а. Используйте различные алгоритмы оптимизации, такие как SGD, Adam, AdaGrad, RMSProp и т. д.

б. Проверьте точность и потери модели во время обучения, минимизируя или максимизируя.

Это шаги, которые необходимо выполнить для решения проблемы машинного обучения; однако каждый шаг имеет разные параметры, которые следует учитывать для успешного завершения проекта машинного обучения.