В последнее десятилетие машинное обучение привлекло так много внимания благодаря своему удивительному применению в современном обществе. В этой статье вы сможете получить общее представление о том, что такое машинное обучение и почему оно так важно, что ученые называют его новым электричеством.

Что такое искусственный интеллект?

От SIRI до самоуправляемых автомобилей искусственный интеллект (ИИ) быстро развивается. В то время как научная фантастика часто изображает ИИ как роботов с человеческими характеристиками, ИИ может охватывать что угодно, от поисковых алгоритмов Google до Watson от IBM и автономного оружия.

Искусственный интеллект сегодня правильно известен как узкий ИИ (или слабый ИИ), поскольку он предназначен для выполнения узкой задачи (например, только распознавание лиц, или только поиск в Интернете, или только вождение автомобиля). Однако долгосрочной целью многих исследователей является создание общего ИИ (AGI или сильного ИИ). В то время как узкий ИИ может превзойти людей в любой конкретной задаче, такой как игра в шахматы или решение уравнений, ОИИ превзойдет людей практически во всех когнитивных задачах.

Что такое машинное обучение?

Машинное обучение — это извлечение знаний из данных. Это область исследований на стыке статистики, искусственного интеллекта и информатики, также известная как прогностическая аналитика или статистическое обучение. Применение методов машинного обучения в последние годы стало повсеместным в повседневной жизни. От автоматических рекомендаций о том, какие фильмы посмотреть, какую еду заказать или какие продукты купить, до персонализированного онлайн-радио и распознавания ваших друзей на ваших фотографиях, многие современные веб-сайты и устройства имеют в своей основе алгоритмы машинного обучения. Когда вы смотрите на сложный веб-сайт, такой как Facebook, Amazon или Netflix, очень вероятно, что каждая часть сайта содержит несколько моделей машинного обучения.

Почему машинное обучение?

На заре «интеллектуальных» приложений многие системы использовали закодированные вручную правила принятия решений «если» и «иначе» для обработки данных или адаптации к пользовательскому вводу. Подумайте о спам-фильтре, задачей которого является перемещение соответствующих входящих сообщений электронной почты в папку со спамом. Вы можете составить черный список слов, из-за которых письмо будет помечено как спам. Это может быть примером использования разработанной экспертами системы правил для разработки «интеллектуального» приложения. Создание правил принятия решений вручную возможно для некоторых приложений, особенно для тех, в которых люди хорошо понимают моделируемый процесс.

Типы обучения

Существует 4 типа машинного обучения, но два из них наиболее часто используются: контролируемое и неконтролируемое обучение.

контролируемое обучение

По сути, когда вы знаете результат, поэтому, работая с набором помеченных данных, скажем, классическим примером является классификация сообщений электронной почты на спам и не спам, вы в основном передаете алгоритму входные данные и вывод, и на его основе алгоритм в конечном итоге предскажет класс из никогда не виденных данных на основе опыта.

Машинное обучение под наблюдением включает два основных процесса: классификацию и регрессию.

  • Классификация — это процесс, при котором входящие данные маркируются на основе прошлых выборок данных и вручную обучают алгоритм распознавать определенные типы объектов и классифицировать их соответствующим образом. Система должна знать, как различать типы информации, выполнять оптическое распознавание символов, изображений или двоичных файлов (соответствует или не соответствует конкретный бит данных конкретным требованиям в виде «да» или «нет») .
  • Регрессия – это процесс выявления закономерностей и прогнозирования непрерывных результатов. Система должна понимать числа, их значения, группировку (например, высоту и ширину) и т. д.

Наиболее часто используемые контролируемые алгоритмы:

  • Линейная регрессия;
  • логистическая регрессия;
  • случайный лес;
  • градиентные деревья;
  • машины опорных векторов (SVM);
  • Нейронные сети;
  • деревья решений;
  • Наивный Байес;
  • Ближайший сосед.

Неконтролируемое обучение

С другой стороны, у вас есть неконтролируемое обучение, при котором вы позволяете алгоритму учиться самостоятельно, формально позволяя алгоритму найти скрытый паттерн в куче данных, нет правильного или неправильного ответа, вы просто обучаете его и ищете. для шаблонов, которые он генерирует.

Алгоритмы обучения без учителя применяют следующие методы для описания данных:

  • Кластеризация: это исследование данных, используемое для сегментации их на значимые группы (т. е. кластеры) на основе их внутренних шаблонов без предварительного знания учетных данных группы. Учетные данные определяются сходством отдельных объектов данных, а также аспектами их отличия от остальных (что также можно использовать для обнаружения аномалий).
  • Уменьшение размерности: во входящих данных много шума. Алгоритмы машинного обучения используют уменьшение размерности, чтобы удалить этот шум при извлечении соответствующей информации.

Со временем вы столкнетесь с двумя другими типами машинного обучения, которым уделяется все больше и больше внимания, читайте внимательно.

Наиболее часто используемые алгоритмы:

  • кластеризация k-средних;
  • t-SNE (встраивание t-распределенных стохастических соседей);
  • PCA (анализ основных компонентов);
  • Правило ассоциации.

Полуконтролируемое обучение

Набор данных содержит как помеченные, так и немаркированные примеры. Обычно количество немеченых примеров намного превышает количество меченых примеров. Цель алгоритма обучения с полуучителем такая же, как и у алгоритма обучения с учителем.

Обучение с подкреплением

Подобласть машинного обучения, в которой машина «живет» в среде и способна воспринимать состояние этой среды как вектор признаков. Машина может выполнять действия в любом состоянии. Разные действия приносят разное вознаграждение, а также могут переводить машину в другое состояние среды. Целью алгоритма обучения с подкреплением является изучение политики. Политика — это функция f (аналогичная модели обучения с учителем), которая принимает вектор признаков состояния в качестве входных данных и выводит оптимальное действие для выполнения в этом состоянии. Действие оптимально, если оно максимизирует ожидаемое среднее вознаграждение.

Наиболее часто используемые алгоритмы:

  • Q-обучение;
  • временная разница (TD);
  • поиск по дереву Монте-Карло (MCTS);
  • Асинхронные агенты актер-критик (A3C).

Вывод

Если вы только собираетесь начать свое машинное обучение и хотите учиться с нуля, я буду делать эту серию, которая будет длиться 5–6 минут о машинном обучении и некоторых побочных проектах в конце каждой главы, так что следите за обновлениями и будьте счастливы обучение

Это мое личное исследование, если у вас есть какие-либо комментарии, пожалуйста, свяжитесь со мной.

Добро пожаловать на мою среднюю страницу

Github, LinkedIn, Захра Эльхамрауи, Upwork