Сети долговременной кратковременной памяти: что это такое и как это работает?

Машинное обучение — это мощная техника, которая учится и совершенствуется на основе своего опыта путем разработки алгоритмов. Алгоритмы — это программы, которые вычисляют, получают доступ и обрабатывают входные данные и предсказывают результаты. Модель машинного обучения предназначена для выполнения сложных вычислений и изучения шаблонов, и на основе этого она дает соответствующий результат. Модель хорошо работает с обычными наборами данных, такими как числовые, бивариантные, многомерные, категориальные и корреляционные наборы данных.

Однако на сегодняшний день большинство моделей машинного обучения сталкиваются с проблемами при прогнозировании данных временных рядов из-за ограничений в понимании контекста входных данных. Вот где помогают рекуррентные нейронные сети, в том числе Long Short Term Memory Networks (LSTM) — тип искусственной нейронной сети. LSTM могут распознавать шаблоны в последовательностях данных, таких как числовые данные временных рядов, исходящие от датчиков, текст, геномы, почерк и произнесенные слова.

Что такое сети LSTM?

LSTM — Long Short Term Memory Networks — это особый тип RNN (рекуррентная нейронная сеть). RNN — это нейронная сеть, которая предоставляет выходные данные предыдущего состояния в качестве входных данных для следующего этапа таким образом, что она может запоминать данные из предыдущего состояния. Он точно предскажет кульминационный результат с помощью предыдущих данных.

Однако RNN страдает от проблемы исчезающего градиента, т. Е. Затухания информации для более длинной последовательности, поэтому возникают трудности с сохранением данных в течение более длительного промежутка времени. Эту проблему можно решить с помощью LSTM. LSTM был разработан, чтобы избавиться от проблемы долгосрочной зависимости и устранить недостаток RNN.

Важность LSTM

В эту современную эпоху машины выполняют задачи с умом, используя машинное обучение. Теперь в каждой отрасли есть огромные исторические данные об устройствах, которые необходимо использовать таким образом, чтобы модель машинного обучения могла эффективно прогнозировать данные.

Как люди, мы нестандартно всегда подбираем некоторые важные ключевые слова и игнорируем другие слова, которые помогут нам понять контекст любого предложения или абзаца. Например, читая рецензию на фильм, мозг пытается запомнить или сосредоточиться только на некоторых ключевых словах, таких как «насыщенный действием», «захватывающий дух», «скучный» и «потрясающий». Каждый раз нам не приходится думать, вспоминать и начинать заново. LSTM также ведет себя аналогично. Кроме того, LSTM однозначно разработан для последовательных наборов данных, где традиционные нейронные сети терпят неудачу. LSTM позволяет сохранять данные.

В каждой отрасли власти будут принимать любое решение на основе важных данных из прошлого, и это обеспечит лучшие результаты. То же самое и с моделями машинного обучения: LSTM демонстрирует точные результаты по сравнению с другими моделями, поскольку запоминает только релевантные данные на протяжении всего обучения модели. Он может легко хранить важную информацию, чтобы делать прогнозы.

Как работает LSTM?

LSTM использует ряд различных логических вентилей. С помощью этого он может регулировать поток информации и решать проблемы с исчезающим градиентом в RNN. Проблема исчезающего градиента возникает во время обратного распространения при обучении модели машинного обучения. Градиенты — это значения, которые можно использовать для обновления весов нейронной сети. Во время обратного распространения градиенты станут настолько минимальными, что могут иметь незначительное значение при обновлении весов.

Это в конечном итоге остановит обучение для этого слоя, чтобы эти слои не обучались. В результате RNN забудет данные на более длительный срок, потому что RNN имеет только кратковременную память.

LSTM и RNN похожи с точки зрения потока управления. Оба обрабатывают информацию по мере ее прохождения и распространения вперед. Единственная разница заключается в операциях внутри каждой ячейки. Основная концепция LSTM заключается в передаче соответствующей информации по всей сети. На основе ввода он добавит эти данные в память, забудет или удалит данные, если они не требуются, и проигнорирует информацию, если она не имеет значения. Вот как LSTM не только передает информацию в следующее состояние, но и сохраняет данные для более поздних состояний.

Работа LSTM разделена на три части, и каждая часть выполняет отдельную функцию следующим образом:

Первая часть определяет, что информация из предыдущей временной метки актуальна, затем запоминает ее, а если она неактуальна, ее можно забыть. Эта часть называется воротами Забвения.
Во второй части ячейка пытается узнать новые данные из текущего ввода в ячейку, которая известна как входной вентиль.
Наконец, в третьей части ячейка передает обновленную информацию из текущей метки времени в следующую метку времени. Эта часть называется выходными воротами.

Вот как LSTM выборочно забывает и запоминает информацию во время обучения.

Приложения LSTM

Промышленный Интернет вещей. Крайне важным для каждой отрасли является постоянное повышение качества продукции. В производственных подразделениях есть множество устройств, датчиков и машин, и каждое из них имеет огромное количество данных. Им уделяется очень мало внимания, что может привести к износу отрасли.
LSTM сыграет жизненно важную роль в приведенном выше случае. Основываясь на исторических данных о различных параметрах, таких как приводы, вибрация, температура, шум и потребление электроэнергии, модель может прогнозировать раннее техническое обслуживание, а также своевременно обнаруживать аномалии в работе машин. Это поможет производителю в своевременном обслуживании. В конечном итоге это повысит эффективность и уменьшит время простоя машин. Полезно увеличить использование устройств. В результате производить продукцию в меньшее время и в большем количестве. Для гигантских энергетических отраслей он может прогнозировать предстоящий спрос на электроэнергию для определенного штата, города или улицы, используя прошлые данные о поставках электроэнергии. Прогнозирование нагрузки на электроэнергию поможет смягчить потери энергии, а также управлять мощностью и передавать ее на основе прогнозов.
Домашняя автоматизация.
В домашней автоматизации есть две основные вещи:
Точность
Скорость обработки и выполнения действий
В «умном» здании системы отопления, вентиляции и кондиционирования воздуха помогают прогнозировать потребление энергии, а также температуру воздуха в помещении и управлять ею в зависимости от погоды на улице. Основываясь на действиях человека, устройства должны выполнять предопределенные задачи, в которых деятельность человека можно распознать, анализируя один за другим видеокадр. Здесь LSTM будет предсказывать следующее действие точно на основе ранних действий.
Любые приложения, связанные со звуковой аналитикой, такие как прогнозирование разбития стекла для обнаружения воров, распознавание речи и прогнозирование голосовых команд. У них есть данные на основе временных рядов, где каждая информация поступает со своей частотой и временем.
В голосовых командах или распознавании речи важно знать фактический контекст, который является сильной стороной LSTM.
Автомобилестроение. Каждая отрасль имеет огромное количество данных о соответствующем рынке, и с помощью этих данных LSTM анализирует предстоящие тенденции рынка и прогнозирует будущий спрос на продукты.
Это поможет производителям автомобилей управлять своей цепочкой поставок и товарными запасами на основе прогнозов спроса и разработать план по ускорению спроса и сокращению ненужных затрат. Это может помочь организации открыть новые возможности, основанные на потребностях рынка. Он также предлагает соответствующие продукты, используя прошлые заказы, розничному покупателю, что обеспечивает лучший пользовательский опыт, а также увеличивает продажи. LSTM дает удовлетворение с точки зрения прогнозирования данных временных рядов.
Здравоохранение. В индустрии здравоохранения сердцебиение, нервные расстройства, кровяное давление и уровень кислорода имеют решающее значение для пациентов, находящихся в тяжелом состоянии и госпитализированных. При изменении любого из этих параметров пациенты могут умереть. Эти параметры должны точно предсказываться на ранней стадии, что помогает в соответствующем лечении пациентов.
Прежде всего, параметры имеют данные временных рядов, в которых LSTM превосходит другие модели. Он также может заранее диагностировать любые проблемы со здоровьем, такие как обнаружение рака или любых серьезных заболеваний, используя отчеты о состоянии здоровья. С помощью умных носимых устройств он может заранее предсказывать сердечные приступы и отправлять сообщение о состоянии их здоровья соответствующему человеку. Он предложит обратиться к врачу в связи с тяжестью состояния здоровья и напомнит о регулярном осмотре.

Первоначально опубликовано на https://volansys.com/blog/long-short-term-memory-networks-lstm/

Сети долговременной кратковременной памяти: что это такое и как это работает?

Что такое сети LSTM?

Важность LSTM

Как работает LSTM?

Приложения LSTM

Вопросы по теме