Базовое машинное обучение

Машинное обучение

Артур Ли Сэмюэл был американским пионером в области компьютерных игр и искусственного интеллекта. Он популяризировал термин «машинное обучение» в 1959 году.

Определение машинного обучения таково:

Говорят, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность в задаче T, измеряемая P, улучшается с опытом E.

Я знаю, что это сбивает с толку, поэтому вот упрощенное определение,

Использование и разработка компьютерных систем, которые могут обучаться и адаптироваться без выполнения четких инструкций, используя алгоритмы и статистические модели для анализа закономерностей в данных и получения выводов.

Когда мы хотим рассказать о львах до пяти лет, мы используем изображения, жесты и цвета, мы говорим о характеристиках львов, таких как шерсть, рык и так далее. Но что, если мы хотим рассказать компьютеру о льве, чтобы компьютер мог автоматически распознавать льва как человека? Мы будем делать то же самое, мы будем говорить компьютеру, как выглядит лев, какого размера лев и какой у него цвет, но здесь наш язык обучения — это язык (или языки) компьютерного программирования, и мы также собираемся использовать то, что называется алгоритмами. и некоторые другие вещи.

Если вы новичок в программировании или компьютерных науках, у вас может возникнуть множество вопросов о технологиях и таких терминах, как алгоритмы и модели. Но не волнуйтесь, мы собираемся исследовать все важные вещи.

Машинное обучение в повседневной жизни

Переводчик Google:

Инструмент перевода Google использует сложное машинное обучение. В Индии Согласно переписи населения Индии 2001 года, в Индии 122 основных языка и 1599 других языков, а в мире говорят примерно на 6500 языках, поэтому потребность в инструменте перевода. Каждый человек любит понимать других людей, чужие культуры и языки играют здесь очень важную роль.

Google Translate поддерживает 109 языков и голосовой ввод для 45 языков. Все это возможно благодаря статистическому машинному переводу (SMT).

Важные термины в машинном обучении:

Алгоритмы:

Набор правил и статистических и математических методов используется для изучения закономерностей на основе данных.

Пример: если вы ищете и смотрите определенный тип контента на Youtube, тогда Youtube начинает рекомендовать такое количество видео на основе вашей истории поиска и истории просмотров, потому что именно так работает алгоритм Youtube. Здесь алгоритм изучает и понимает шаблоны из вашей истории поиска и истории просмотров.

Модель:

Модель машинного обучения — это файл, обученный распознавать определенные типы шаблонов. Модель обучается с использованием алгоритма машинного обучения и обучающих данных. Алгоритмы отображают все решения, которые модель должна принимать на основе входных данных, а затем модель использует алгоритмы машинного обучения для извлечения полезных идей и шаблонов и получения точных результатов.

Переменная-предиктор:

Это функция (или функции) данных, которую можно использовать для прогнозирования выходных данных.

Предположим, мы прогнозируем уровень успеха человека на основе количества прочитанных им книг. Здесь прогнозирующей переменной является количество книг.

Переменная ответа:

Это функция или выходная переменная, которую необходимо прогнозировать с помощью переменной-предиктора.

Возьмем снова предыдущий пример.

Предположим, мы прогнозируем уровень успеха человека на основе количества прочитанных им книг. Здесь прогнозирующей переменной является количество книг, а переменной ответа является показатель успешности человека.

Переменная ответа также известна как целевая переменная.

Объединение данных

Данные для обучения:

Модель машинного обучения, созданная с использованием обучающих данных. Это начальный набор данных, которые помогают обучить машину. Иногда обучающие данные представлены в виде наборов данных тарирования.

Если мы хотим научить машину распознавать собаку, то сначала мы должны показать машине столько изображений собаки, чтобы машина научилась распознавать собаку. Здесь изображения собаки - это тренировочные данные.

Данные тестирования:

Модель машинного обучения оценивается с использованием данных тестирования. Данные тестирования просто используются для проверки эффективности модели.

Большая часть данных для обучения больше, чем данные для тестирования. И данные обучения, и данные тестирования являются входными данными, которые мы передаем машине или модели.