«Что такое машинное обучение» - это вопрос, на который были даны ответы в более чем тысячах сообщений в блогах по всему миру! Однако, прежде чем углубляться в изучение технической части машинного обучения, важно, чтобы вы были знакомы с общим представлением о машинном обучении и его приложениях.

Так что же такое машинное обучение?

Проще говоря, машинное обучение - это наука, дающая компьютеру возможность учиться, думать и действовать как человек! Это метод науки о данных, который используется для прогнозирования поведения, результатов и тенденций путем анализа существующих данных. Машинное обучение позволяет компьютерам учиться без явного программирования.

Где найти машинное обучение?

Настоящий вопрос: «где мы не можем найти машинное обучение?», и ответ на него: НИГДЕ! Сегодня машинное обучение можно найти почти в каждом секторе. является. Инженеры по машинному обучению смогли интегрировать машинное обучение во все сектора, от финансового сектора до сектора здравоохранения!

Почему так важно машинное обучение?

Представьте, что вам дали набор изображений, на которых изображены люди. А теперь представьте, что я говорю вам написать код, чтобы определить, есть ли на этих фотографиях конкретный человек. Я уверен, что если вы программист, то знаете, что это чрезвычайно сложная задача! Однако, если вы научитесь машинному обучению, эта задача станет намного проще.

Каждую секунду мир создает гигантские объемы данных, и машинное обучение является чрезвычайно мощным инструментом для анализа этих данных и помогает генерировать идеи, получать прогнозы и т. Д. Например, все ваши рекомендации по песням и фильмам на таких сайтах, как Youtube и Netflix создан благодаря машинному обучению.
Теперь, когда у нас есть приблизительное представление о том, что такое машинное обучение, давайте немного поговорим о технике, не так ли?

Как работает машинное обучение?

Машинное обучение можно разделить на две основные категории:

  • Контролируемое обучение
  • Неконтролируемое обучение

Контролируемое обучение

Как следует из названия, эта категория подразумевает машинное обучение под наблюдением. Здесь мы предоставляем как ввод, так и желаемый вывод, используя классы или теги (обучающие примеры). Затем система выводит функцию, используя предоставленный набор обучающих примеров, которая используется для последующего прогнозирования правильного ответа при предоставлении новых примеров.

Контролируемое обучение подразделяется на задачи регрессии и задачи классификации.

Проблемы классификации: предоставленные входные данные делятся на два или более классов, и система должна создать модель, которая назначает совершенно новые входные данные одному или нескольким из вышеупомянутых классов.

Проблемы регрессии: метод обучения с учителем, при котором результаты являются непрерывными, а не дискретными.

Похоже на жаргон? Позвольте мне рассказать вам об этом.

Начнем с классификации! Рассмотрим этот простой пример. Гипотетически предположим, что злокачественность опухоли зависит от размера опухоли и возраста человека. Теперь рассмотрим набор данных, показанный ниже:

Из приведенных выше данных мы можем получить следующий график:

Здесь мы представили доброкачественные опухоли синим цветом, а злокачественные - желтым. Машинное обучение используется для самостоятельной настройки функции в соответствии с приведенными выше данными, как показано ниже:

Теперь, когда мы предоставим этой обученной модели новые данные, она сможет определить, является ли опухоль злокачественной или доброкачественной. То есть (в этом примере), если входные данные представлены слева от функциональной строки, они могут быть отнесены к категории доброкачественных, а если они представлены справа от функциональной строки, они могут быть отнесены к категории злокачественных. .

И это классификация! Теперь перейдем к регрессу; Предположим, вам дана пачка картинок соответствующего возраста. Вы можете использовать алгоритм машинного обучения для обучения модели в соответствии с этими данными. Таким образом, когда вы предоставите новую картинку, система сможет предсказать возраст этого человека!

Неконтролируемое обучение

Неконтролируемое обучение в основном находит в данных скрытые закономерности или внутренние структуры. В этой категории не используются размеченные данные, и наиболее часто используемым методом обучения без учителя является кластеризация.

Если вы используете фотографии Google, кластеризацию представить не сложно. Вы заметили, что все ваши фотографии распределены по папкам, каждая из которых представляет определенного человека? Поэтому, когда вы нажимаете на одного человека, вы можете получить все фотографии, на которых этот человек присутствует.

Это кластеризация! Он группирует данные после обнаружения в них скрытого шаблона. Таким образом, обучение без учителя заставляет машину выяснять все скрытые взаимосвязи, особенности и поведение.

Если вы зашли так далеко, поздравляем!
Теперь вы знаете основы, необходимые для начала пути к машинному обучению! В следующей главе мы рассмотрим предварительную обработку данных как в R, так и в python, чтобы начать работу.