Что такое Edge Intelligence и как он изменит приложения машинного обучения.

Помните время, когда облачные вычисления были модным словом. Это было в 2011-2012 годах. На самом деле, согласно Gartner, облачные вычисления в то время уже скатывались в пропасть и теперь, возможно, нет, определенно находятся на плато производительности [NEWSWIRE].

Перенесемся на десятилетие вперед (да, мы с вами старые, и да, мы с вами — задроты), и теперь вы видите это новое крепкое объятие ИИ. Тенденция, похоже, заключается в том, чтобы *перетасовать колоду, вытащить карту* и просто добавить ее к ИИ.

Ответственный ИИ

Генеративный ИИ

Композитный ИИ

Объяснимый ИИ

«Дай мне перерыв» ИИ

Давайте посмотрим, что сделал с нами 2020 год (разумеется, помимо короны)

Произошла интересная вещь.

Edge AI или даже Embedded AI сейчас находятся на пике завышенных ожиданий. С несколькими большими пушками в технологической индустрии от NVIDIA, Google до Xilinx; вскочить на подножку. [ХАМЗА АЛИ].

Что такое пограничный ИИ?

До недавнего времени почти все вычисления ИИ выполнялись удаленно в центрах обработки данных, на основных устройствах предприятия или на пограничных процессорах телекоммуникаций, а не локально на устройствах. Это связано с тем, что вычисления ИИ чрезвычайно требовательны к процессору и требуют для выполнения сотен (традиционных) микросхем различных типов. Размер оборудования, стоимость и энергопотребление сделали практически невозможным размещение вычислительных массивов ИИ в чем-то меньшем, чем сундучок.

Теперь периферийные чипы искусственного интеллекта меняют все это. [ДЕЛОЙТ]

Термин, который используется вместе с Edge и Embedded AI, — ускоритель AI. Это как раз те периферийные ИИ-чипы, о которых упоминает Deloitte.

Ускоритель ИИ – это класс специализированных аппаратных ускорителей или компьютерных систем, предназначенных для ускорения приложений искусственного интеллекта, особенно искусственных нейронных сетей, машинного зрения и машинного обучения. Типичные приложения включают алгоритмы для робототехники, интернета вещей и другие задачи, требующие обработки больших объемов данных или датчиков.[WIKI-AI-ACC]

В начале 2019 года Google выпустила процессор TPU Edge для встроенного приложения для логического вывода. TPU Edge использует TensorFlow Lite, который кодирует модель нейронной сети с параметрами низкой точности для логического вывода, запуская модели машинного обучения при входном напряжении 5 В [GOOGLE-TPU]. И это только ОДИН из многих продуктов, список только растет, а производительность как по точности, так и по энергоэффективности улучшается.

Некоторые даже заявляют, что закон Мура умер и что в обозримом будущем не столько сокращение полевых транзисторов, сколько последовательное внедрение все более разнообразных технологий устройств, интегрированных во все более разнородные компьютерные архитектуры, оптимизированные для повышения производительности и энергоэффективности. . [Тайс, Т. Н. и Вонг]

Пограничные вычисления были предложены как путь вперед. Будущая экосистема для крупномасштабных вычислений видится как этот децентрализованный, демократизированный аппарат, который продвигает облачные сервисы от ядра сети к краям сети, которые находятся в непосредственной близости от устройств IoT и источников данных [ZHAO].

Причина, по которой граничные вычисления кажутся такими многообещающими, заключается в том, что они решают несколько ключевых проблем, которые мешают развертыванию машинного обучения в облаке [ZHAO].

  1. Безопасность данных и конфиденциальность

Интернет вещей и мобильные устройства генерируют огромное количество данных, которые могут быть конфиденциальными. Таким образом, также важно защитить конфиденциальность и безопасность данных рядом с источником данных для периферийного интеллектуального приложения на этапе вывода модели.

  1. Низкий уровень подключения

Необходимо свести к минимуму накладные расходы во время вывода модели DNN в периферийном интеллектуальном приложении, особенно дорогостоящее использование пропускной способности глобальной сети для облака. Накладные расходы на связь здесь в основном зависят от режима вывода DNN и доступной полосы пропускания.

2. Ограничения мощности.

Накладные расходы на вычисления и связь при выводе модели DNN приводят к большому потреблению энергии. Для периферийного интеллектуального приложения большое значение имеет энергоэффективность, на которую влияет размер модели DNN и ресурсы на граничных устройствах.

3. Требования к низкой задержке

Для некоторых интеллектуальных мобильных приложений реального времени (например, для мобильных игр AR/VR и интеллектуальных роботов) обычно действуют строгие требования к срокам, например, задержка 100 мс. На показатель задержки влияет множество факторов, в том числе ресурсы на периферийных устройствах, способ передачи данных и способ выполнения модели DNN.

Так это просто ФАД?

Умные машины, работающие на чипах ИИ, могут помочь расширить существующие рынки, поставить под угрозу действующих лиц и изменить распределение прибыли в таких отраслях, как производство, строительство, логистика, сельское хозяйство и энергетика.

Возможность собирать, интерпретировать и немедленно реагировать на огромные объемы данных имеет решающее значение для многих приложений с большими объемами данных, которые, по мнению футуристов, становятся широко распространенными: видеонаблюдение, виртуальная реальность, автономные дроны и транспортные средства и многое другое. Это будущее во многом зависит от того, что сделают возможным периферийные ИИ-чипы: внедрение интеллекта в устройство. [ДЕЛОЙТ]

По сути, ваш Iphone с шестиядерным процессором (2x3,1 ГГц Firestorm + 4x1,8 ГГц Icestorm) и графическим процессором Apple (4-ядерная графика) — это чудовищная машина, это такая трата, что мы используем его в основном для бездумного чирикать.

Однако у исследователей есть другой план.

Напишите мне в Linkedin, что ВЫ думаете, где будет Edge Intelligence в ближайшие 2–5 лет

Источники:

[ЧЖАО](https://arxiv.org/pdf/1905.10083.pdf)

[NEWSWIRE](https://www.globenewswire.com/news-release/2020/08/21/2081841/0/en/Cloud-Computing-Industry-to-Grow-from-371-4-Billion-in -2020-to-832-1-миллиард-к-2025-при-CAGR-из-17-5.html)

[ХАМЗА АЛИ]](https://arxiv.org/ftp/arxiv/papers/2009/2009.00803.pdf)

[GOOGLE-TPU](https://cloud.google.com/edge-tpu)

[WIKI-AI-ACC](https://en.wikipedia.org/wiki/AI_accelerator)

[DELOITTE](https://www2.deloitte.com/us/en/insights/industry/technology/technology-media-and-telecom-predictions/2020/ai-chips.html)

[Тайс, Т. Н., и Вонг, Х.-С. П. (2017). Конец закона Мура: новое начало информационных технологий. Вычисления в науке и технике, 19 (2), 41–50. doi:10.1109/mcse.2017.29](https://sci-hub.se/10.1109/MCSE.2017.29)