С тех пор как наши предки заговорили на своих первых мирах, люди разработали инструменты, которые облегчили их жизнь, а также помогли понять мир, в котором они жили. От каменных топоров, методов рыболовства, религии и политических систем до даже космических кораблей, которые могут путешествовать в космос люди разработали технологии, которые изменили наше восприятие мира и то, как мы с ним взаимодействуем.

Многое из этого вплоть до последних столетий достигалось лишь ограниченным восприятием человеком окружающего мира. Сегодня мы развились до такой степени, что вместо того, чтобы ограничивать наше восприятие только нашими пятью чувствами, мы используем компьютеры, машинное обучение и статистические алгоритмы, чтобы расширить наше восприятие мира, в котором мы живем, тем самым делая «невидимыми» вещи, которые мы не мог воспринимать что-то, с чем мы можем работать и принимать сложные решения за нас, Homo Sapiens.

Недавно мы придумали машинное обучение, набор методов, которые могут сделать эту работу за нас. Он появился как математическая реализация искусственного интеллекта, предоставив нам алгоритмы, которые могут решить все проблемы, которые мы упомянули. После всего сказанного давайте повернем время вспять и посмотрим, как все это началось.

История машинного обучения

Прежде чем даже думать о том, чтобы заставить машины учиться самостоятельно, необходимо было заложить математические основы, чтобы воплотить это в жизнь. Первым шагом к созданию этих машин было создание компьютеров, то есть машин, которые могут самостоятельно производить вычисления, следуя набору инструкций, определенных людьми. Для этого в наборе команд используется особый тип алгебры, названный Булевой алгеброй в честь Джорджа Буля, философа 18 века. Эта новая алгебра сократила все значения до «True» и «False» и до сих пор используется современными процессорами CPU.

Наряду с этим Чарльз Бэббидж разработал компьютер с перфокартами, известный как первый теоретический компьютер. Эта машина была универсальной машиной, которая использовала перфокарты для выполнения определенных инструкций, поэтому ее можно было программировать. Имея это в виду, Ада Лавлейс разработала первый алгоритм для решения математических операций с помощью машины Чарльза Бэббиджа, что сделало ее первым программистом в истории.

В 20 веке, между Первой и Второй мировыми войнами, британец Алан Тьюринг провел первые исследования современной компьютерной архитектуры. В своих исследованиях, вдохновленный тем, как мы выполняем задачи, выполняя определенные шаги, он теоретизировал универсальную машину, которая могла бы выполнять и расшифровывать набор инструкций, известную как машина Тьюринга, концепции которой позже были использованы в архитектуре фон Неймана. Кроме того, эти концепции использовались во время Второй мировой войны для расшифровки немецкой криптографической энигмы. В области машинного обучения, движимый вопросом Могут ли машины думать?, он позже предложил Игру в имитацию как тест, чтобы определить, является ли компьютер разумным, попросив человека отличить человека от компьютера при общении с ним. их обоих через машинописные сообщения» (Би-би-си).

К моменту публикации статей Тьюринга уже было построено несколько разумных машин. Марвин Мински и Дин Эдмондс в 1951 году сделали первые шаги в искусственных нейронных сетях, создав Стохастический нейронный аналоговый компьютер с усилением (SNARC), компьютер, который имитировал работу человеческого мозга. Позже в том же десятилетии Фрэнк Розенблатт разработал первую искусственную нейронную сеть человека, известную как Perceptron, целью которой было выявление закономерностей и распознавание форм, а также, как ожидалось, решение многих проблем, с которыми сталкивалось человечество.

Хотя Perceptron Роземблата был огромным шагом в том, что мы сегодня знаем как машинное обучение, у него была серьезная проблема: он работал только с линейными разделимыми задачами. Это означает, что персептрон не мог идентифицировать нелинейные проблемы, такие как проблема XOR. К сожалению, это вызвало то, что известно как первая зима, период времени между 60-ми и 80-ми годами, когда инвестиции в искусственный интеллект были сокращены, поэтому в этой области не проводилось много исследований.

К счастью, к концу 80-х и началу 90-х появились новые подходы, которые разрабатывались для решения этой проблемы, и был разработан многослойный персептрон, подход, который позволил исследователям использовать множество персептронов для решения этих нелинейных разделимых задач. проблемы. Наряду с этим появилось обратное распространение с прямой связью, алгоритм, который позволял многослойному персептрону учиться на предыдущих данных. Эти достижения позволили машинному обучению процветать в современном обществе, и многие приложения машинного обучения разрабатываются до сих пор.

Машинное обучение сегодня

В 1996 году компьютер IBM Deep Blue стал первым компьютером, победившим чемпиона мира по шахматам Гарри Каспарова, что раньше было даже немыслимо. Он использовал компьютер грубой силы, чтобы заглянуть вперед между 6 и 20 ходами, чтобы лучше расположить свои фигуры для победы в матче. 20 лет спустя DeepMind AI от Google разрабатывается для игры в стратегию в реальном времени Starcraft 2, которая победила первого профессионального игрока Дарио «TLO» Вюнша. Игра не детерминирована, что означает, что в ней нет счетного количества ходов, которые может сделать игрок, а также предполагает длительные стратегические ходы планирования. Целью этих исследований является открытие новых способов обучения и решения проблем в реальных жизненных задачах, что позволяет добиться прогресса в различных областях, таких как бдительность, управление ресурсами и военная стратегия.

Вместе с тем появилось множество приложений в различных областях знаний. В области цифровой обработки изображений реставрация фотографий на основе искусственного интеллекта была разработана для восстановления старых военных фотографий. В химии ИИ использовался для предсказания значений констант, используемых при разработке лекарств. В информационной безопасности методы кластеризации использовались для классификации вредоносных программ Android. Из того, что было сказано, существует множество способов применения машинного обучения к различным задачам, от регрессии до задач классификации, которые основаны на моделях, следующих этим стратегиям: обучение с учителем, обучение без учителя, обучение с подкреплением.

Контролируемое обучение

Обучение с учителем — это набор алгоритмов, которые используют размеченные данные для прогнозирования невидимых данных в том же формате. Он охватывает алгоритмы регрессии, такие как линейная регрессия и K ближайших соседей (KNN), которые получают данные и пытаются оценить значение на основе обученного набора данных. Он также охватывает проблемы классификации со случайными лесами и вспомогательными машинными векторами (SVM), которые вместо непрерывных значений для прогнозирования оценивают метки данных.

В качестве примера обучения с учителем для классификации предположим набор данных, состоящий из изображений животных. Каждое изображение в наборе данных помечено в соответствии с животным, которое изображено на изображении. Когда мы обучаем контролируемую модель, она может предсказать животное на невидимых изображениях модели и, в зависимости от настроек, дать вероятность быть определенным животным на основе набора обучающих данных.

Для задачи регрессии в обучении с учителем предположим связанную систему водоснабжения, как показано на следующем рисунке:

Теперь предположим, что мы хотим предсказать высоту водяного столба в правом резервуаре. Чтобы сделать модель, мы могли бы использовать уровень воды в левом баке и напряжение в водяном насосе, который качает воду в левый бак. В этом случае мы попытаемся провести регрессию, чтобы найти выходное значение. Этот пример поясняет, что машинное обучение можно использовать в таких областях, как системы управления, которые, как известно, имеют множество нелинейных проблем, и эти модели помогают преодолеть эту проблему.

Неконтролируемое обучение

В неконтролируемой модели машинного обучения набор данных не имеет помеченных выходных данных. Основная цель машинного обучения в этом случае — найти метки для этих ситуаций, оценивая создание кластеров на основе расстояния между каждым наблюдением в наборе данных. Каждому наблюдению будет присвоена метка на основе расстояния от него до кластера, представляющего метку, которая обновляется после подбора всех данных или во время потока данных входных данных, в зависимости от алгоритма. В качестве примеров алгоритмов есть иерархическая кластеризация, K-средние и DBSCAN, которые в двух первых мы можем заранее определить количество кластеров, где на DBSCAN кластеры формируются на основе данных и количества наблюдений в данных. .

В примере обучения без учителя мы могли бы использовать модель K-средних для кластеризации цветов изображений, уменьшая количество цветов в изображении до количества кластеров, тем самым сжимая изображение как результат модели.

Обучение с подкреплением

Модели обучения с подкреплением — это стратегия обучения, в которой она не пытается кластеризовать данные, регрессировать или классифицировать значения, а вместо этого реализует систему вознаграждения, основанную на входных данных, которые приносят наибольшую пользу, и наоборот. Основное внимание уделяется онлайн-обучению, поэтому требуется сбалансировать возможности изучения новых данных и использования текущих знаний.

Глубокое обучение

Глубокое обучение — это подход к машинному обучению, который использует нейронные сети для достижения своих целей. Это может быть как обучение с учителем, так и обучение без учителя, и оно соединяет несколько нейронов для вычисления выходных данных.

В контролируемом обучении у нас есть сверточные нейронные сети, которые используются в нейронных сетях обработки изображений, а также повышают производительность сети за счет выявления закономерностей на изображении.

Ссылки









«История машинного обучения
Первый случай использования нейронных сетей произошел в 1943 году, когда нейрофизиолог Уоррен Маккалох и математик Уолтер Питтс…www.doc.ic.ac. Соединенное Королевство"









https://www.sciencedirect.com/science/article/pii/S0045790617303087