Основы машинного обучения

История машинного обучения

Термин машинное обучение был впервые введен Артуром Сэмюэлем в 1959 году. Он был американским пионером в области компьютерных игр и искусственного интеллекта.

Определение машинного обучения

Машинное обучение называется подмножеством искусственного интеллекта, которое в основном связано с разработкой алгоритмов, позволяющих компьютеру самостоятельно учиться на данных и прошлом опыте.

Отсюда возникает следующий вопрос, т.

Q1)Как машины учатся?

Ответ) Обучающие данные.
Специалисты по данным используют данные для обучения моделей машинного обучения, которые могут делать прогнозы на основе взаимосвязей, которые они обнаруживают в данных.

Q2)Как работает машинное обучение?

Ответ) Прежде чем мы углубимся в то, как это работает, мы должны понять модели машинного обучения.

Модели машинного обучения

Система машинного обучения учится на обученных данных, используя алгоритм, и всякий раз, когда она получает новые данные, прогнозирует их результат.

Данные для обучения – это образец исторических данных. От текстовых сообщений, электронных писем и сообщений в социальных сетях, которые мы отправляем, до фотографий и видео, которые мы снимаем на наши телефоны, мы генерируем огромное количество информации. Еще больше данных создается миллионами датчиков в наших домах, автомобилях, городах, инфраструктуре общественного транспорта и на заводах. Данные обучения далее делятся на помеченные данные и немаркированные данные. Точность прогнозируемого вывода зависит от количества данных, поскольку огромное количество данных помогает построить лучшую модель, которая более точно предсказывает вывод.

Используемый алгоритм находит отношения между характеристиками образцов (входные данные) и помеченными/обучающими данными. Чем меньше временная сложность алгоритма, тем быстрее будет вывод.

Например, работаете над машинным обучением?

Предположим, волонтеры хотят идентифицировать разные породы собак с помощью приложения для телефона.

Команда специалистов по собакам и ученых собирает фотографии разных пород собак.
Команда маркирует образцы правильной породой.
Маркированные данные обрабатываются с помощью алгоритма, который находит связи между признаками образцов и маркированной породой.
Результаты алгоритма инкапсулируются в модель.
Когда добровольцы находят новые образцы, модель может определить правильный ярлык породы.

Размеченные и неразмеченные данные

Немаркированные данные. Данные состоят из образцов природных или созданных человеком артефактов, которые вы можете относительно легко получить из окружающего мира. Некоторые примеры немаркированных данных могут включать фотографии, аудиозаписи, видео, новостные статьи, твиты и т. д. Они просто содержат данные, и здесь нет значащих «тегов», «ярлыков» или «классов».

Размеченные данные. Он берет набор неразмеченных данных и помещает их в какой-то значимый «тег», «метку» или «класс», которые каким-то образом информативны или желательны для понимания.

Тип машинного обучения

3 типа машинного обучения -

контролируемое обучение
Неконтролируемое обучение
Обучение с подкреплением

Обучение с учителем. В этом типе обучения используются помеченные обучающие данные.

Неконтролируемое обучение. Этот тип используется, когда данные не помечены.

Обучение с подкреплением. Используется, когда некоторые данные помечены, а некоторые нет.

Основы машинного обучения

Вопросы по теме