Машинное обучение 101

К настоящему моменту вы, вероятно, уже хорошо знаете, что большие данные и искусственный интеллект — главные революционеры практически во всех сферах. Понимание ситуации может быть сложной задачей, особенно для бизнес-клиентов, которые хотят внедрять инновации, но не знают, с чего начать. В сегодняшнем блоге я надеюсь оставить вас, дорогие читатели, с базовым пониманием того, как работает машинное обучение, и как оно может быть полезно для вашей организации.

Во-первых, давайте обсудим, какое место машинное обучение занимает в мире больших данных. Простите цитату из Википедии, но это хорошее резюме: «Машинное обучение — это подмножество искусственного интеллекта в области компьютерных наук, которое часто использует статистические методы, чтобы дать компьютерам возможность «обучаться» (т. е. постепенно улучшать производительность при выполнении конкретной задачи). ) с данными, без явного программирования». (1) Машинное обучение — это метод разработки (или получения) сложных моделей и алгоритмов, которые можно применять к набору данных для выполнения конкретной задачи.

Рис. 1. Исходное изображение Даля Винтерса, 2015 г.

Машинное обучение является частью искусственного интеллекта и само по себе является зонтиком для множества подходов (примерами, о которых вы, возможно, слышали, являются искусственные нейронные сети, генетические алгоритмы, деревья решений и т. д.).

На высоком уровне машинное обучение работает, используя данные для поиска шаблонов в этих данных, чтобы создать модель, которая может точно предсказать результат. Со временем, при наличии достаточного количества данных для сложности задачи, с помощью сложной математической и статистической оптимизации разрабатывается новая модель, которая, по сути, идентифицирует отношения в данных, которые могут быть не сразу распознаны человеком, учитывая объем или сложность данных.

Гипотетический пример

Рассмотрим организацию, которая обеспечивает уход за пожилыми людьми. Мы можем предположить, что у них достаточно данных о повседневной жизни, взаимодействиях, истории покупок и т. д. старшего, находящегося под их наблюдением. Теперь давайте предположим, что эта организация хочет свести к минимуму воздействие вируса гриппа на своих пациентов. Без машинного обучения мы знаем симптомы гриппа… но проблема в том, что к тому времени, когда симптомы проявляются, уже слишком поздно! Мы хотим иметь возможность искать закономерности в поведении, окружающей среде и демографических данных человека, чтобы определить, когда он подвергается высокому риску заражения гриппом, и в результате изменить наш подход (например, целевая литература, чтобы информировать их об их риске). . Мы можем взять объем данных и передать его алгоритму машинного обучения для поиска возникающих паттернов, которые, возможно, изначально не были распознаны человеком. Возможно, мы обнаружим, что пожилые люди, живущие в том же городе, что и их дети, подвергаются повышенному риску (внуки — это микробные фабрики), или те, кто регулярно играет в бинго по вечерам в четверг, как ни странно, подвергаются меньшему риску! Эти шаблоны являются результатом машинного обучения. Мы вернемся к этому примеру, чтобы понять, как мы туда попали.

Существует два подхода к обучению алгоритма машинного обучения: обучение с учителем и обучение без учителя.

При обучении с учителем данные, предоставляемые для обучения алгоритма, содержат как входные, так и выходные данные или результаты этих данных. Таким образом, алгоритм получает «обратную связь», имея возможность сравнивать свои результаты с фактическими результатами. Обучение с учителем представляет собой большую часть машинного обучения. Он идеально подходит для большинства приложений, но организации не всегда могут позволить себе набор данных, содержащий ожидаемые результаты.

Обучение без учителя, напротив, обычно имеет совершенно другой результат, чем обучение с учителем. Вместо того, чтобы ответить на конкретный вопрос, обучение без учителя часто способно только предложить понимание данных. Он может выявлять закономерности и ассоциации, а также кластеры данных, которые могут дать представление, но вряд ли смогут выполнить конкретную задачу.

Возвращаясь к нашему примеру

Если у нашей организации есть многолетние данные об их пациентах, а также о том, заразились ли они гриппом в определенное время года, у нас есть хорошая база для проведения контролируемого обучения. Если бы мы не смогли связать результаты с конкретным вопросом, наши данные были бы непригодны для решения проблемы, и вместо этого мы могли бы использовать машинное обучение для поиска интересных закономерностей в данных, которые в результате могут привести к различным гипотезам.

Машинное обучение: конкурентное преимущество

Ваши данные являются ценным корпоративным активом, и применение машинного обучения — один из способов извлечь выгоду для бизнеса из этого виртуального золотого рудника. Многие организации, работающие с данными, используют эти возможности для анализа рынка, создания конкурентоспособных продуктов и повышения качества обслуживания своих клиентов.

(1) Авторы Википедии. (2018, 11 июля). Машинное обучение. В Википедии, бесплатной энциклопедии. Получено 13:09, 13 июля 2018 г., с https://en.wikipedia.org/w/index.php?title=Machine_learning&oldid=849817385.

Машинное обучение 101

Гипотетический пример

Возвращаясь к нашему примеру

Машинное обучение: конкурентное преимущество

Вопросы по теме