DeepMind, подразделение Google, которое разрабатывает передовые инструменты машинного обучения для решения человеческих задач, недавно опубликовало AlphaTensor, алгоритм искусственного интеллекта для поиска гораздо более эффективных способов умножения матриц. Эта операция, которая может показаться немного занудной и специфической, на самом деле является неотъемлемой частью видеоигр и коммуникационных систем и, безусловно, требует значительных вычислительных ресурсов.

На протяжении веков математики тратили много времени, пытаясь найти более быстрые способы умножения матриц. Тем не менее, существующие способы сделать это все еще медленны. Например, один из таких известных ученых, Фолькер Штрассен, 50 лет назад разработал алгоритм, ускоряющий этот процесс для матриц 2×2. Наши текущие приложения, однако, основаны на матрицах гораздо больших размеров, которые мы до сих пор не знаем, как эффективно умножать.

Специалисты по данным из DeepMind пришли, чтобы перевернуть ситуацию. Они построили на базе AlphaZero нейронную сеть, которая сама учится играть в настольные игры, такие как шахматы, и обыграла некоторых из величайших игроков в мире. Чтобы использовать ее, они сопоставили матричное умножение. задачу в однопользовательскую игру, в которой ИИ должен был сам найти небольшие наборы инструкций для быстрого получения точных матричных умножений. Поиск управляется итеративным процессом, в котором модель вознаграждается каждый раз, когда ее ответ оказывается быстрее и лучше. Начав с того, что совсем не знал, как умножать матрицы, AlphaTensor постепенно совершенствовался, достигнув сначала самого тот же набор операций, который мы научились использовать в курсах линейной алгебры, затем воспроизвели некоторые другие оригинальные способы, разработанные для определенных размеров матриц, и, наконец, создали гораздо лучшие алгоритмы с меньшим количеством шагов.

Эта стратегия поощрения известна как обучение с подкреплением и, по сути, то же самое, что мы делаем, когда дрессируем наших собак: агент ИИ решает предпринять действия в заранее определенной среде, а интерпретатор предоставляет ему награда каждый раз, когда полученное состояние улучшается. Эти алгоритмы все чаще используются не только в играх, включая автономное вождение, торговлю акциями и даже для обучения роботов!

В Arionkoder у нас есть отличные специалисты по данным, которые могут помочь вам найти новые возможности для внедрения этого типа технологии искусственного интеллекта в ваш бизнес. Свяжитесь с нами здесь и узнайте, чего мы можем достичь вместе.

Первоначально опубликовано на https://blog.arionkoder.com 14 октября 2022 г.