Классификация - это подход к обучению с учителем в машинном обучении. Например, это процесс категоризации или «классификации» объектов в «классы». Мы можем определить взаимосвязь между набором функциональных переменных и важной целевой переменной. Целью является категориальная переменная с дискретными значениями.

  • В районе K-ближайших соседей

Очень высокое значение K (например, K = 100) дает чрезмерно обобщенную модель, а очень низкое значение k (например, k = 1) дает очень сложную модель.

  • Классификатор с меньшими потерями бревна имеет лучшую точность.

Точность - это количество прогнозов, в которых прогнозируемое значение совпадает с фактическим. Точность не всегда является хорошим индикатором из-за того, что он имеет характер «да» или «нет». Log Loss учитывает неопределенность вашего прогноза в зависимости от того, насколько он отличается от фактического значения. Меньшее значение журнала - потери означает лучшие прогнозы.

  • При построении дерева решений мы хотим разделить узлы таким образом, чтобы уменьшить энтропию и увеличить получение информации.

Классификация с деревом решений. Построение дерева решений - это поиск атрибута, который возвращает наивысший информационный выигрыш. Прирост информации основан на уменьшении энтропии после разделения набора данных по атрибуту.