Руководство по машинному обучению для начинающих

Машинное обучение - очень знакомое слово в мире технологий. Это одна из самых интересных областей информатики. Но для новичка это слово не будет так много значить. Итак, чтобы начать путь к машинному обучению (ML), давайте сначала узнаем, что такое ML и что с ним можно сделать.

Что такое машинное обучение (ML)?

Искусственный интеллект или ИИ в основном делится на две большие области: Машинное обучение и Искусственные когнитивные системы. Эти две области вдохновлены поведением человеческого мозга. Человеческий мозг может достичь высоких способностей с помощью практики и символических рассуждений. ML основан на тренировочных возможностях человеческого мозга. Поэтому ML - это обучение на большом количестве примеров, даже без знания теории. Точно так же искусственные когнитивные системы вдохновлены способностью человеческого мозга к символическому мышлению. Есть два основных определения машинного обучения.

«Область обучения, которая дает компьютерам возможность учиться без явного программирования». - Артур Сэмюэл

«Считается, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеренная с помощью P, улучшается с опытом E». - Том Митчелл

Из двух приведенных выше определений определение Тома Митчелла немного сложное, но все же дает современное определение. Однако простыми словами ML - это создание машины для обучения с использованием заданного набора данных, точно так же, как люди изучают вещи на практике.

Как работает машинное обучение?

Давайте посмотрим, как студенты готовятся к экзамену. Перед экзаменом они читают заметки, ссылаются на видео и лекции, задают много вопросов и готовятся ко всем типам вопросов, которые могут быть заданы. Таким образом ученики кормят свой мозг большим количеством достоверных данных. Они тренируют мозг знаниями, чтобы легко находить подход или логику, необходимые для решения заданного вопроса. То же самое и в машинном обучении. Так модели встроены в машинное обучение. В машинном обучении для определения параметров модели используется большой набор данных. После того, как все параметры определены правильно посредством обучения модели, мы рассматриваем модель как обученную модель. Затем эта обученная модель используется для поиска выходных данных заданного входа.

Машинное обучение против традиционного программирования

В традиционном программировании мы разрабатываем программу или логику. Когда вводится, программа запускается в машине и выдает вывод в соответствии с логикой. Но в Машинном обучении мы снабжаем машину данными (как входными, так и выходными) во время обучения, и машина сама создает логику или программу. Эта логика оценивается во время тестирования.

Некоторые приложения машинного обучения

  1. Прогнозы
  2. Распознавание речи
  3. Распознавание изображений
  4. Медицинский диагноз
  5. Видеонаблюдение
  6. Услуги в социальных сетях
  7. Фильтрация вредоносных программ
  8. Онлайн-руководство для клиентов
  9. Онлайн-рекомендации
  10. Обнаружение мошенничества и т. Д.

В целом проблемы машинного обучения можно разделить на три категории: контролируемое обучение, неконтролируемое обучение, и полу-контролируемое обучение.

Что такое контролируемое обучение?

Когда машина обучается с помеченными данными (данными, имеющими как входные, так и выходные параметры), это называется обучением с учителем. Здесь мы знаем как входные, так и выходные данные в наборе данных, и алгоритм учится на обучающем наборе данных, пока не достигнет приемлемого уровня. Это похоже на то, как учитель контролирует ученика в процессе обучения. Поэтому это называется обучением с учителем. В контролируемом обучении мы прогнозируем конкретное количество или метку. Регрессия и классификация являются примерами контролируемых методов обучения. Некоторыми популярными примерами алгоритмов контролируемого обучения являются линейная регрессия, случайный лес и машина опорных векторов.

Что такое обучение без учителя?

Когда машина обучается с данными, которые не помечены (набор обучающих данных содержит только входные данные и не имеет представления о выходе), это называется обучением без учителя. Это позволяет модели действовать на основе информации без руководства. При таком подходе к обучению нет правильного ответа, как и нет учителя. Так что это называется обучением без учителя. Здесь задача машины состоит в том, чтобы сгруппировать данные на основе сходства, различий и закономерностей. Кластеризация и ассоциация - это методы обучения без учителя. Некоторыми примерами алгоритмов неконтролируемого обучения являются кластеризация K-средних и алгоритм Apriori.

Что такое полу-контролируемое обучение?

Когда машина обучается с набором данных, в котором некоторые данные помечены, а некоторые нет (набор обучающих данных, в котором отсутствуют некоторые выходные данные), мы используем подход к обучению с частично контролируемым контролем. В этом подходе сначала применяется обучение без учителя, и данные разделяются на группы, а затем метод обучения с учителем используется для присвоения ярлыков этим группам.

Каковы основные методы машинного обучения?

  1. Классификация: машина учится на входных данных и выдает результат наблюдения в виде категории или класса. Это метод обучения с учителем. Используемый набор данных может быть просто двухклассным или многоклассовым. В зависимости от количества классов в наборе данных после обучения модели наблюдения могут быть отнесены к соответствующему классу. Вот несколько примеров: определение письма как спама или нет и определение человека как мужского или женского пола.

2. Регрессия. Связь между входными и выходными переменными выражается в виде линейного или нелинейного уравнения. Здесь вывод - это значение, а не метка или категория. Это также метод обучения с учителем, который может применяться только к помеченным данным. Регрессия также называется методом аппроксимации кривой. В этом подходе, как и в других методах, нам нужно найти наиболее подходящую модель или функцию, которая дает более точный результат.

3. Кластеризация: входные данные (набор данных) для машины группируются в набор кластеров без предварительного знания кластеров. Это подход к обучению без учителя, который имеет дело с немаркированными данными. Здесь машина должна найти шаблон для группировки данных в кластеры. Точки данных, принадлежащие одному кластеру, однородны. Примером может служить группировка клиентов по их покупательским привычкам.

Чтобы решить, какой метод подходит для конкретной проблемы, нам необходимо тщательно проанализировать цели анализа набора данных таким образом, чтобы обеспечить наилучшее решение решаемой проблемы.

Это простое и краткое введение в машинное обучение. Надеюсь, это помогло вам получить краткое представление о машинном обучении. Это только начало, и впереди еще долгий путь.

Ваше здоровье!!!!