Машинное обучение — горячая тема, и оно меняет мир вокруг нас. Тем не менее, многие из нас до сих пор мало знают об этой новой области. Крайне важно понять, что такое машинное обучение, поскольку оно переопределяет и формирует нашу повседневную жизнь. Пришло время рассмотреть это как часть решения в вашем бизнесе, если вы еще этого не сделали.

Хотите верьте, хотите нет, но в машинном обучении нет ничего нового. Он был задуман 50 лет назад Артуром Сэмюэлем. Он развился из изучения «распознавания образов и теории вычислительного обучения в искусственном интеллекте». Машинное обучение использует статистические методы, чтобы дать компьютерным системам возможность обучаться и адаптироваться. Затем они могут делать прогнозы на основе этих данных. Например, алгоритм машинного обучения может определить, купит ли человек подушки, потому что недавно купил новый диван. Алгоритм может сделать этот прогноз благодаря предыдущим данным, когда другие люди, покупающие диваны, также покупали подушки. Он развился из науки о распознавании закономерностей и использования теории вычислительного обучения в искусственном интеллекте (ИИ). За последние 5 лет машинное обучение становится все более распространенным явлением. Теперь это неотъемлемая часть программного обеспечения для многих крупномасштабных и высокопрофильных приложений. Почему шумиха? И почему сейчас?

Данные повсюду

Благодаря популярности таких приложений, как Netflix, Facebook, Twitter и LinkedIn, данных о пользователях предостаточно! Когда данные очень большие, становится все труднее разобраться в них и использовать их для повышения ценности для клиентов. Используя алгоритмы и модели для выполнения работы, которую люди не могут выполнять, машинное обучение может адаптировать индивидуальные решения для нужд конечных пользователей, в основном с очень высокой точностью.

Сегодня здравоохранение и маркетинг/реклама значительно выигрывают от машинного обучения.

Эндрю Берт и Сэмюэл Волхенбоум подчеркивают важность машинного обучения в здравоохранении. Эта технология предлагает врачам информацию о состоянии критических пациентов в отделениях неотложной помощи. В одном примере они демонстрируют исследование, проведенное для отделений неотложной помощи, чтобы предсказать шансы пациента умереть, проведя 24 часа в отделении неотложной помощи. Алгоритм выполнен с кричащей точностью в 90%!

Джон Джерсин объясняет, как LinkedIn использует машинное обучение, чтобы адаптировать поиск работы для пользователей на платформе. Машинное обучение не только выявляет тенденции и делает прогнозы, но и адаптируется к изменяющимся резюме пользователей. Он может ежедневно следить за различными объявлениями о вакансиях, а также за новыми областями знаний, добавляемыми на платформу. Благодаря этой постоянной эволюции данных он по-прежнему может адаптировать целевой контент для пользователя. Будь то соискатель, HR/рекрутер или компания, публикующая вакансию, LinkedIn может сопоставить пользователям роли в соответствии с навыками соискателя.

Отличительной чертой использования алгоритмов машинного обучения в LinkedIn было устранение необходимости в бумажной работе и пустой трате времени. Тем временем мы продолжаем делать идеальное соответствие между вакансиями и соискателями без проблем, быстрее и точнее.

Сиянг Чен, коллега из Rangle и специалист по машинному обучению, говорит: «Мы находимся на переломном этапе, когда вокруг нас есть устройства, постоянно собирающие данные. У нас есть очень благодатная почва для машинного обучения и алгоритмов, которые могут масштабироваться, обучаться и лучше адаптироваться к тенденциям».

Хранение намного дешевле

Одной из самых больших проблем машинного обучения в прошлом была доступность наборов данных. Сегодня, когда стоимость облачных хранилищ снизилась, хранение больших объемов данных перестало быть проблемой. Внедрять машинное обучение в бизнес-решения стало проще. Это благодаря росту аналитики, метрик и доступных наборов данных CRM.

Google объявила о своем Google one, сделав облачное хранилище дешевле, чем когда-либо! Это только вопрос времени, когда другие компании, такие как Amazon и Microsoft, последуют их примеру.

Гиганты в этой области поощряют машинное обучение и делают его доступным

Google также анонсировала свой комплект ML на Google I/O 2018, он очень прост в использовании и загружается с firebase. Хорошая вещь в том, что его можно использовать на мобильных устройствах, они предоставили разработчикам базовый алгоритм/модель, которая предлагает хорошую степень прогнозирования, достаточную для основных задач машинного обучения, которые они могут запускать локально (в автономном режиме) на устройстве. Модель будет учиться и тренироваться впоследствии без необходимости обратного подключения к облаку. Это делает ML очень простым в использовании и доступным для тех, кто не является экспертом в этом вопросе.

Использование машинного обучения Amazon (AWS) выросло на 250%, более чем вдвое за год. Они создали простую в использовании игровую площадку для разработчиков, чтобы проверить свои теории машинного обучения. Это обеспечивает отличную инфраструктуру и настройку для использования больших объемов данных или масштабирования, когда данные становятся больше.

Apple предоставила Core ML для разработчиков, предоставив им полезный API, который поможет любому разработчику, не имеющему предварительных глубоких знаний в области машинного обучения. Он поддерживает многие стандартные функции ML/AI, такие как анализ изображений, основу для обработки естественного языка и многие другие.

Инициативы правительства

К настоящему временинесколько стран начали национальные инициативы по поддержке и поощрению ИИ, частью которого является машинное обучение. Мировые лидеры осознают, как эта сфера изменит правительства. Канада выделила 125 миллионов долларов в рамках своей Панканадской искусственной стратегии для поддержки исследований и обучения в надежде на то, что Канада станет лидером в этой области. Эта мощная поддержка со стороны правительства Канады увеличила инвестиции в эту область до более чем 1 миллиарда долларов только за последний год.

Культура более восприимчива

Культурные изменения — большая часть того, почему машинное обучение набирает обороты и масштабируется так быстро. Люди больше привыкли слышать об этом и привыкают к использованию этого в повседневной жизни. Мы больше полагаемся на эту технологию (осознанно или неосознанно), чтобы выполнять повседневные задачи.

Машинное обучение упрощает жизнь людей, позволяя компьютерам решать задачи, которые до сих пор выполнялись людьми.

Главный вопрос, который задают технологические компании, заключается не в том, «зачем использовать машинное обучение», а в следующем:

  • «Как мы применяем машинное обучение»
  • «какие варианты использования принесут пользу нашей компании»
  • «Как мы можем использовать это в нашем решении»
  • «Как мы достигаем наших целей с помощью ML»

Это нагруженные вопросы, но если подойти к ним с правильным мышлением и правильной стратегией, это окажется полезным для компании, идущей в ногу с технологиями и будущим.

Вот несколько отправных точек, которые следует учитывать, если вы планируете использовать машинное обучение как часть своего решения:

Собирайте данные заранее и уделяйте особое внимание качеству

По словам Сияна, качество данных является наиболее важной частью достижения хорошего решения. Он говорит: «Качество данных должно быть хорошим, поэтому нам нужно заранее обучать клиента. Сбор данных должен начинаться на ранних этапах проектирования и реализации продукта, чтобы у нас было достаточно данных для улучшения алгоритмов. Иногда это приходит как запоздалая мысль, и возможности теряются».

Это, вероятно, будет самым сложным шагом, имея достаточно данных для обучения алгоритмов, а также предоставляя чистые данные с уменьшенным шумом для повышения точности моделей.

Конфиденциальность под контролем

В связи с тем, что последние разногласия между Facebook и Cambridge Analytica и утечка данных набирают обороты, конфиденциальность и безопасность данных стали горячей темой. Ученые и специалисты в области технологий прилагают усилия к использованию различных методов для снижения рисков. Компании несут большую ответственность за обеспечение конфиденциальности данных, которые они собирают о своих пользователях. Существует множество подходов, в том числе:

Анонимизация данных, что затрудняет установление личности. Один из способов приблизиться к этому — собрать данные, агрегировать их, а затем иметь два отдельных сервера, один для идентификации, а другой — для анонимных данных. Цель состоит в том, чтобы чрезвычайно затруднить выделение личности из данных, используемых машинным обучением. Другой пример — использование псевдонимов вместо настоящего имени пользователя.

Использование дифференциальной конфиденциальности [Rf*] основано на том, чтобы узнать как можно больше о группе и как можно меньше узнать о каждом члене в ней. Это достигается путем добавления достаточного случайного шума к агрегированным данным, хотя его применение будет зависеть от законов и правил страны и обеспечения соответствия данных им. Теперь возникает вопрос о том, насколько это соответствует или дополняет GDPR. Показано, что это очень мощный и многообещающий подход. Другие похожие работы по этому подходу можно найти здесь. Для обзора системной архитектуры, сочетающей в себе дифференциальную конфиденциальность и передовые методы обеспечения конфиденциальности, группа дифференциальной конфиденциальности написала хорошо документированную статью, чтобы учиться у пользователей.

Проект Google Sidewalk labs в Торонто будет использовать передовые технологии и максимально использовать машинное обучение, что обеспечит большую эффективность, но какой ценой будет конфиденциальность? Только время покажет, какие подходы будут предприняты для обеспечения конфиденциальности и безопасности данных людей, а также их права на участие и выход из этого проекта.

Наймите правильную команду

Это может показаться пустяком, но в большинстве случаев инициативы по использованию машинного обучения как части решения терпят неудачу, потому что для достижения успеха не была создана правильная команда.

В хорошей команде для запуска пилотного проекта должно быть как минимум два разработчика, знающих Python, R или любой другой предпочитаемый язык, способный эффективно решать задачи машинного обучения. Вам понадобится руководитель стратегии в команде, который поможет направить проект от пилотного этапа до готовности к производству, а также реализовать долгосрочные цели программного обеспечения. Для обучения и адаптации внутренних данных требуется аналитик данных. Это очень важно, потому что они действительно понимают данные, знают, что искать, что можно сделать с данными и чего ожидать, оказывая большую поддержку всему проекту.

Эта комбинация правильных навыков поможет вам начать работу и настроит вас на успех. Чтобы узнать больше о том, что такое машинное обучение или что ваша команда будет применять, Приядхаршини написала хорошую статью, в которой объясняется обучение машинному обучению.

Теперь, если у вас возникли проблемы с наймом людей с такими навыками, которые большинству компаний кажутся сложными, Сиянг предлагает увеличить потенциал вашей компании с помощью машинного обучения, создав учебную группу, которая представляет собой команду из нескольких профессионалов, выбранных внутри компании. Эта команда уже будет состоять из инженеров, являющихся экспертами в предметной области, которые будут знать различные аспекты проекта.

Выделите свою компанию среди конкурентов с помощью машинного обучения

В условиях очень сильной конкуренции на рынке в настоящее время компании пытаются разными способами выделиться среди своих конкурентов, и машинное обучение кажется лучшим выбором для достижения успеха.

Меган Бек и Барри Либерт очень красиво формулируют этот факт: Возможности машинного обучения — это то, что отличает хорошую платформу от плохой. Они привели в пример monster.com, где машинное обучение не применялось, в сравнении с LinkedIn или Glassdoor, которые поняли, что кучи резюме стали слишком большими, чтобы пользователи могли их обрабатывать и находить подходящие вакансии. Они предоставили такое же решение, используя машинное обучение.

Еще одним примером того, насколько мощным машинное обучение было для старых компаний, является Netflix, который заново изобрел себя и предоставляет контент, адаптированный к уникальным предпочтениям пользователей.

Исследования, образование и поиск экспертов

Одним из моих любимых действий является изучение рынка и того, что делается в этой области. Важно узнать о различных методах и о том, как они применимы к вашему бизнесу, чтобы вы могли реализовать правильное решение, имея при этом надежную стратегию и долгосрочное видение. Интернет полон подтверждающей документации, вот две отличные статьи, демонстрирующие правильные вопросы, которые следует задавать при рассмотрении машинного обучения:

Заключение

В заключение, ажиотаж вокруг машинного обучения реален. На самом деле, это настолько хорошо обосновано, что журнал Forbes прогнозирует, что бизнес удвоит использование машинного обучения к 2018 году! При наличии огромных объемов данных, дешевых хранилищ, комплектов машинного обучения, предоставляемых лидерами отрасли, и финансировании со стороны правительств и инвесторов, машинное обучение имеет все составляющие, которые должны быть приняты компаниями. Если вы еще не думаете об этом, это то, к чему идет будущее. Что может быть лучше, чем начать прямо сейчас!