Компании могут использовать возможности, которые ИИ и машинное обучение могут себе позволить в области автоматизации управления ИТ-инфраструктурой, для повышения гибкости, производительности и эффективности. Добавленная стоимость настолько очевидна, что многие ИТ-компании, которые владеют центрами обработки данных, такими как Google, Amazon, Microsoft и Facebook (например, facebook + 500 ТБ / день в 2012 году), и даже другие не ИТ-компании, которые генерируют огромное количество данных в день , участвуют в великой гонке за внедрение его концепций и методов с такими целями, как:

· Снижение затрат, чтобы быть более конкурентоспособными и предлагать более низкую цену за свои услуги.

· Эффективное управление ресурсами за счет оптимизации усилий при правильном выборе рабочих нагрузок

· Самостоятельные ИТ-платформы (в автономном режиме) с минимальным вмешательством пользователя

Решение ИТ-задач с помощью машинного обучения:

Команды DevOps управляют несколькими системами на нескольких мониторах, отслеживают информационные панели, показатели, инциденты и предупреждения, чтобы предотвратить любые проблемы или простои. Обычно они перегружены, им не хватает времени, видимости и реального приоритета. DevOps нужна более умная система управления инцидентами, которая упростит их работу и сэкономит время и усилия за счет автоматизации процессов. Основная система мониторинга, которая может быть установлена ​​поверх всех их платформ для фильтрации журналов, сопоставления событий, анализа показателей, предупреждений и устранения неполадок, как у человека, поиска решений и их применения без вмешательства человека.

Машинное обучение является основным ключом к таким инструментам, которые меняют способ управления инфраструктурой, поскольку оно переводит ИТ-операции из реактивного режима в режим прогнозирования.

Машинное обучение и AIOps:

Приложение машинного обучения для управления ИТ-операциями путем автоматического выявления и реагирования / решения проблем в режиме реального времени называется AIOps, что означает искусственный интеллект для ИТ-операций.

Дополнительные преимущества AIOps:

Компании генерируют массивные наборы данных (события, журналы, данные метрик), генерируемые оборудованием, операционными системами, программным обеспечением (серверы и приложения), элементами сети (маршрутизаторы, брандмауэры, интеллектуальная сеть), системами мониторинга и системами регистрации неисправностей. Эти наборы данных можно собирать; отформатировать и, наконец, прорезать его до актуального, изучая операционные шаблоны на основе этих исторических данных, чтобы улучшить и автоматизировать управление ИТ-инфраструктурой, и это то, что мы называем AIOps.

AIOps решает многие аспекты контроля и обслуживания ИТ-платформ, чтобы предоставлять решения, упрощающие весь процесс:

· Анализ вероятных причин: агрегирование и анализ коррелирующих журналов для получения полного обзора и более легкого определения связанных тенденций и закономерностей, а также выявления взаимосвязей между событиями и проблемами ( пример, корреляция между обновлением в одной системе и поломкой в ​​другой системе ). В результате поиск и устранение неисправностей устраняет первопричины быстрее и точнее.

· Снижение шума предупреждений: путем группировки, фильтрации и определения приоритета неважных предупреждений и инцидентов, поэтому алгоритмы машинного обучения учатся игнорировать стандартные сообщения журнала, такие как регулярные обновления системы, но позволяют обнаруживать новые или необычные сообщения. и отмечен для расследования.

· Планирование мощностей:

o Прогностическое масштабирование путем прогнозирования спроса, прогнозирования требований к емкости (диск, ОЗУ, ЦП) и автоматического масштабирования и масштабирования на основе прогнозной информации, полученной из исторических данных.

o сопоставление рабочих нагрузок с правильными серверами и конфигурациями виртуальных машин, рекомендуя правильный тип семейства экземпляров, варианты хранения и их пропускную способность ввода-вывода, конфигурацию сети и т. д.

o Обнаружение зомби-виртуальных машин и неиспользуемых ресурсов.

· Обнаружение аномалий: оповещение об аппаратном, программном или безопасности (взломах и нарушениях) аномалиях за счет использования методов обнаружения выбросов в машинном обучении (вторжений), что позволяет обнаруживать и предотвращать события риска.

· Маршрутизация инцидентов: назначение инцидентов нужной команде в нужное время в системе регистрации неисправностей.

· Прогнозирующее управление событиями: заблаговременно предупреждайте о проблемах и возможных сбоях, которые могут произойти.

Самоконтроль и самовосстановление вашей среды перед лицом сбоев (распознавание проблем и инициирование ответов: блокировка портов, применение исправлений и обновление аппаратного и программного обеспечения)

Заключение

Благодаря AIOps сбои и простои обрабатываются проактивно, а системы постепенно улучшаются с использованием исторических и текущих сервисных и технических данных. Он заменяет программно-определяемую инфраструктуру (SDI) инфраструктурой, определяемой искусственным интеллектом (ADI), которая может самообучаться и восстанавливаться практически автономно.