Первая статья для тех, кто только начинает заниматься машинным обучением.

По крайней мере, это то, что мне говорят несколько первых результатов поиска, когда я гугулю статьи по машинному обучению для начинающих. Эта статья была написана Лео Брейманом в 2001 году.

В трех предложениях:

  1. Цель статистики - использовать данные для решения проблем, но упор следует делать на проблему, а не на данные.
  2. Сфера статистики в академических кругах (еще в 2001 году) была слишком сфокусирована на моделях данных (регрессия мышления), применяя их к ситуациям, где они неуместны, и делала отрывочные выводы.
  3. Вместо этого в этой области должна быть открыта идея использования алгоритмических моделей (подумайте об алгоритмах случайного леса и машинном обучении), которые меньше связаны с моделированием данных и больше с точностью прогнозирования - самая важная метрика для многих задач с практическим применением