Введение в машинное обучение

Термин «машинное обучение» был придуман Артуром Сэмюэлем в 1959 году, американским пионером в области компьютерных игр и искусственного интеллекта, который заявил, что «оно дает компьютерам возможность обучаться без явного программирования».
А в 1997 году Том Митчелл дал «хорошо сформулированное» математическое и реляционное определение: «Говорят, что компьютерная программа учится на опыте E в отношении некоторой задачи T и некоторого показателя производительности P, если ее производительность на T, измеряемая P, улучшается с опытом. Э.

Машинное обучение — последнее модное словечко, циркулирующее вокруг. Это того заслуживает, так как это одна из самых интересных областей компьютерных наук. Так что же на самом деле означает машинное обучение?

Давайте попробуем понять машинное обучение с точки зрения непрофессионала. Представьте, что вы пытаетесь выбросить бумагу в мусорное ведро.

После первой попытки вы понимаете, что приложили слишком много усилий. После второй попытки вы понимаете, что находитесь ближе к цели, но вам нужно увеличить угол броска. Здесь происходит то, что в основном после каждого броска мы чему-то учимся и улучшаем конечный результат. Мы запрограммированы учиться на собственном опыте.

Это означает, что задачи, связанные с машинным обучением, предлагают принципиально операционное определение, а не определение области в когнитивных терминах. Это следует за предложением Алана Тьюринга в его статье «Вычислительные машины и интеллект», в которой вопрос «Могут ли машины думать?» заменяется вопросом «Могут ли машины делать то, что можем делать мы (как мыслящие сущности)?»
В области анализа данных машинное обучение используется для разработки сложных моделей и алгоритмов, которые поддаются прогнозированию; в коммерческом использовании это известно как прогнозная аналитика. Эти аналитические модели позволяют исследователям, специалистам по данным, инженерам и аналитикам «вырабатывать надежные, воспроизводимые решения и результаты» и раскрывать «скрытые идеи» посредством изучения исторических взаимосвязей и тенденций в наборе данных (входных данных).

мл | Что такое машинное обучение?

Артур Сэмюэл, пионер в области искусственного интеллекта и компьютерных игр, ввел термин «Машинное обучение». Он определил машинное обучение как «Область исследования, которая дает компьютерам возможность учиться без явного программирования».
Проще говоря, машинное обучение (МО) можно объяснить как автоматизацию и улучшение процесса обучения компьютеров на основе их опыта без фактического программирования, то есть без какой-либо помощи человека. Процесс начинается с подачи данных хорошего качества, а затем обучения наших машин (компьютеров) путем построения моделей машинного обучения с использованием данных и различных алгоритмов. Выбор алгоритмов зависит от того, какой тип данных у нас есть и какую задачу мы пытаемся автоматизировать.

мл | Введение в данные в машинном обучении

ДАННЫЕ: это может быть любой необработанный факт, значение, текст, звук или изображение, которые не интерпретируются и не анализируются. Данные — это самая важная часть всей аналитики данных, машинного обучения и искусственного интеллекта. Без данных мы не сможем обучить ни одну модель, и все современные исследования и автоматизация окажутся напрасными. Крупные предприятия тратят много денег только на то, чтобы собрать как можно больше определенных данных.
Пример. Почему Facebook приобрела WhatsApp, заплатив огромную цену в 19 миллиардов долларов?
Ответ очень просто и логично — это иметь доступ к информации пользователей, которой может не быть у Facebook, но будет у WhatsApp. Эта информация их пользователей имеет первостепенное значение для Facebook, поскольку она облегчит задачу улучшения их услуг.

ИНФОРМАЦИЯ: данные, которые были интерпретированы и обработаны и теперь имеют некоторые значимые выводы для пользователей.
ЗНАНИЯ: сочетание предполагаемой информации, опыта, знаний и идей. Приводит к повышению осведомленности или созданию концепции для человека или организации.

Машинное обучение — приложения

Приложения машинного обучения включают в себя:

  • Система веб-поиска. Одна из причин, почему поисковые системы, такие как google, bing и т. д., работают так хорошо, заключается в том, что система научилась ранжировать страницы с помощью сложного алгоритма обучения.
  • Приложения для добавления тегов к фотографиям. Будь то facebook или любое другое приложение для добавления тегов к фотографиям, возможность отмечать друзей делает их еще более актуальными. Все это возможно благодаря алгоритму распознавания лиц, работающему за приложением.
  • Детектор спама: наш почтовый агент, такой как Gmail или Hotmail, выполняет за нас большую работу по классификации писем и перемещению писем со спамом в папку со спамом. Это снова достигается с помощью классификатора спама, работающего в задней части почтового приложения.

Как различные ТНК используют ML/AI

Вы когда-нибудь задумывались, как Netflix, YouTube или поисковые системы, такие как Google, или социальные сети, такие как Facebook, Twitter, дают лучшие результаты своим клиентам или как Tesla работает над автономными автомобилями. Если да, то этот блог для вас. Я собираюсь рассказать об основных концепциях, лежащих в основе многих сервисов, которые мы используем сегодня. Да, процесс, называемый машинным обучением, стоит за всеми услугами, которыми мы пользуемся сегодня. Будь то рекомендации по продуктам, голосовая помощь, фильтрация спама и вредоносных программ по электронной почте, поддержка клиентов, обнаружение мошенничества и многое другое. Итак, давайте сначала обсудим, что такое машинное обучение.

Как Tesla использует машинное обучение

Как мы все знаем, Tesla является пионером в области производства электромобилей. Tesla во главе с Илоном Маском — это нарицательное имя в автомобильной промышленности. Единственная цель состояла в том, чтобы доказать, что электромобили могут быть лучше, чем традиционные автомобили, работающие на топливе.

По словам Tesla, с помощью своего программного обеспечения они собрали данные о пробеге более 100 миллионов миль. Затем они компилируют эти данные для создания дорожных карт для беспилотных автомобилей. Tesla собирает данные обо всех своих автомобилях, а также об их водителях с помощью датчиков, которые могут собирать информацию о положении рук водителя на приборах и о том, как они ими управляют. Все эти данные помогают им модифицировать свою систему во всех аспектах. По мнению исследователей из McKinsey and Co, к 2030 году объем собранных данных составит 750 миллиардов долларов. Tesla использует эти данные для создания плотных карт, которые показывают увеличение трафика до рисков, которые вызовут рост принять участие.

Tesla использует машинное обучение в облаке, которое отвечает за обучение всего автопарка на индивидуальном уровне. Они используют некоторую обрезку краев, которая решает, какое действие необходимо предпринять. Автомобили также могут образовывать сети с другими автомобилями Tesla поблизости, чтобы делиться некоторой информацией. Tesla использовала существующие базы данных клиентов для анализа данных, используя их для понимания требований клиентов и регулярно обновляя свои системы соответствующим образом. Илон Маск заявил, что 2020 год станет годом, когда Tesla выпустит свою полную систему автономного вождения, построенную на автопилоте.

Как Netflix использует машинное обучение

Netflix — это потоковый сервис, который предлагает широкий выбор отмеченных наградами телешоу, фильмов, аниме, документальных фильмов и многого другого — на тысячах подключенных к Интернету устройств.

Netflix имеет огромную коллекцию контента, и день ото дня она быстро увеличивается, поэтому пользователи могут не найти интересующий их контент. Вот почему Netflix использует систему рекомендаций, чтобы рекомендовать фильмы и шоу своим пользователям. Это одна из лучших функций Netflix. Netflix использует историю своих пользователей, чтобы рекомендовать, какие шоу и фильмы им было бы интересно посмотреть. Это позволяет пользователям потреблять данные наилучшим образом. Кроме того, это увеличивает количество просмотров, а также минимальный порог, который компания определяет для успеха, а также ежемесячную подписку. Netflix также использует данные своих пользователей при производстве любых фильмов и шоу в зависимости от местоположения. Использование данных помогает решить, какую историю лучше всего снять, какие актеры и режиссеры лучше всего подходят для этой истории, каков должен быть бюджет проекта.

Как Twitter использует машинное обучение

Twitter — это платформа социальной сети, которая позволяет своим пользователям отправлять и читать микроблоги длиной до 280 символов, известные как «твиты», со своими подписчиками. Это важно для новостных репортажей, продвижения событий, маркетинга и бизнеса. Twitter использует искусственный интеллект для улучшения пользовательского опыта.

Twitter использует искусственный интеллект, чтобы рекомендовать релевантные твиты своим пользователям. Алгоритм искусственного интеллекта Twitter сканирует тысячи твитов в секунду и ранжирует их для каждого пользователя. Twitter также использует ИИ для фильтрации нежелательного контента с платформы. Twitter также использует искусственный интеллект для ранжирования твитов. Алгоритм ранжирования Twitter имеет множество данных, которые он обработал с помощью модели глубокого обучения и узнал, какие твиты будут релевантными для любого конкретного пользователя. Все твиты оцениваются на основе режима ранжирования, нравится это пользователю или нет. Модель ранжирования ранжирует твиты на основе контента, изображения или видео, а также количества полученных лайков или ретвитов. Twitter использует навыки IBM Watson и NLP для отслеживания и удаления оскорбительных твитов. Twitter постоянно пересматривает свой алгоритм, чтобы соответствовать требованиям платформы. Twitter использует различные инструменты, основанные на искусственном интеллекте, для улучшения взаимодействия с пользователем и своих услуг.

Использованная литература :

https://mc.ai/how-various-mncs-using-ml/

https://www.geeksforgeeks.org/machine-learning/