Есть пять вопросов, на которые отвечает наука о данных:

На каждый из этих вопросов отвечает отдельное семейство методов машинного обучения, называемых алгоритмами. Полезно думать об алгоритме как о рецепте, а о ваших данных как об ингредиентах. Алгоритм говорит, как объединить и смешать данные, чтобы получить ответ.

В. 1 Это А или Б?

На этот вопрос отвечает семейство алгоритмов, называемое алгоритмом классификации. Это семейство алгоритмов называется двухклассовой классификацией. Это полезно для любого вопроса, который имеет только два возможных ответа.

Этот вопрос также можно перефразировать, включив в него более двух вариантов ответа: это А, или В, или С, или D, и т. д.? Это называется мультиклассовой классификацией, и она полезна, когда у вас есть несколько возможных ответов. Мультиклассовая классификация выбирает наиболее вероятный.

В. 2 Это странно?

На этот вопрос отвечает семейство алгоритмов, называемых обнаружением аномалий. Обнаружение аномалий помечает неожиданные или необычные события или поведение. Это дает подсказки, где искать проблемы.

В. 3 Сколько — или — Сколько?

Машинное обучение также может предсказать ответ на вопрос «Сколько?». или Сколько? Семейство алгоритмов, отвечающее на этот вопрос, называется регрессией. Они помогают ответить на любой вопрос, который требует числа.

В. 4 Как это организовано?

Иногда вы хотите понять структуру набора данных — как это организовано? Чтобы найти структуру данных, одним из подходов является кластеризация. Он разделяет данные на группы для облегчения интерпретации. Понимая, как организованы данные, вы можете лучше понять и предсказать поведение и события.

В. 5 Что мне делать дальше?

Вопрос — Что мне теперь делать? — использует семейство алгоритмов, называемых обучением с подкреплением. Обучение с подкреплением было вдохновлено тем, как мозг человека реагирует на наказание и вознаграждение. Эти алгоритмы учатся на результатах и ​​принимают решение о следующем действии.

Как правило, обучение с подкреплением хорошо подходит для автоматизированных систем, которым приходится принимать множество мелких решений без участия человека. Вопросы, на которые он отвечает, всегда касаются того, какие действия должны быть предприняты — обычно машиной или роботом. Алгоритмы обучения с подкреплением собирают данные по мере их поступления, обучаясь методом проб и ошибок.