Классификация - это подход к обучению с учителем в машинном обучении. Например, это процесс категоризации или «классификации» объектов в «классы». Мы можем определить взаимосвязь между набором функциональных переменных и важной целевой переменной. Целью является категориальная переменная с дискретными значениями.
- В районе K-ближайших соседей
Очень высокое значение K (например, K = 100) дает чрезмерно обобщенную модель, а очень низкое значение k (например, k = 1) дает очень сложную модель.
- Классификатор с меньшими потерями бревна имеет лучшую точность.
Точность - это количество прогнозов, в которых прогнозируемое значение совпадает с фактическим. Точность не всегда является хорошим индикатором из-за того, что он имеет характер «да» или «нет». Log Loss учитывает неопределенность вашего прогноза в зависимости от того, насколько он отличается от фактического значения. Меньшее значение журнала - потери означает лучшие прогнозы.
- При построении дерева решений мы хотим разделить узлы таким образом, чтобы уменьшить энтропию и увеличить получение информации.
Классификация с деревом решений. Построение дерева решений - это поиск атрибута, который возвращает наивысший информационный выигрыш. Прирост информации основан на уменьшении энтропии после разделения набора данных по атрибуту.