Чтобы решить конкретную проблему, практикующие специалисты должны выбрать приемлемый алгоритм обучения. Общее эмпирическое правило заключается в том, что для задач классификации мы должны использовать алгоритмы с высокой точностью, тогда как для задач регрессии мы должны выбирать алгоритмы с более низкой точностью, но более высокой надежностью, поскольку абсолютная частота ошибок не имеет значения. Вот несколько примеров: Линейная регрессия: Линейная регрессия использует принцип линейности для прогнозирования непрерывных значений из набора входных переменных. Это достигается за счет минимизации суммы квадратов ошибок. Этот метод является быстрым и масштабируемым для больших наборов данных, поскольку он позволяет избежать перебора всех возможных ответов; тем не менее, он нестабилен.

В двух словах, линейная регрессия использует линейность для разработки уравнения для прогнозирования непрерывного значения на основе двух или более входных переменных. Логистическая регрессия (LR): когда есть только два возможных результата (0/1), логистическая регрессия используется в качестве бинарного классификатора. Это уменьшает количество ложноположительных и ложноотрицательных результатов, что означает, что мы никогда не должны принимать что-то истинное за что-то ложное или наоборот.

Нейронные сети. Нейронные сети используются в машинном обучении для решения проблем категоризации и включения концепций нейробиологии, таких как работа человеческого мозга. Когда точки данных имеют несколько независимых измерений, но только одно выходное значение, они используются. Нейронные сети состоят из множества скрытых слоев нейронов, каждый из которых имеет свою функцию активации, и последний слой для вывода. Они используются для решения проблем, которые не являются линейными или которые сложно решить с помощью существующих методов.

В нейронных сетях две наиболее распространенные функции активации — это сигмовидная (также известная как логистическая функция) и ступенчатая. SVM (машины опорных векторов): SVM известен в некоторых академических кругах как «северо-восточный» алгоритм; она широко признана лучшей моделью различительного обучения под наблюдением, доступной сегодня для задач классификации. Это особенно полезно, когда имеется только одна целевая метка, точки данных линейно разделены/непрерывны, а выборки из всех классов имеют примерно одинаковый размер.

С другой стороны, SVM печально известен своей нестабильностью и дороговизной для большинства реальных задач. SVM характеризуются как линейные или нелинейные в зависимости от того, является ли их граница решения гиперплоскостью. Алгоритмы на основе дерева: многие задачи классификации могут быть представлены в виде древовидной структуры, где каждый внутренний узел представляет собой логический тест, а ребро между двумя узлами сигнализирует, что если мы выберем правильный путь в одном узле, мы должны выбрать левый путь в другом. другие, чтобы выйти из него (примеры включают C4.5, CHAID и т. д.). Деревья решений используются, когда точки данных имеют несколько независимых измерений, но только одно выходное значение; они генерируются с использованием рекурсивного бинарного разделения (разделения в узле с максимальным приростом информации).

Я наткнулся на этот тренинг по машинному обучению, который довольно информативен и помог мне в моем обучении.