Автор: Raphael Dang-Nhu
Neurips 2020
Бумажная ссылка
Github link
Дополнительная ссылка

Введение

기존의 인공지능 연구는 2가지의 подход가 있었다. 하나는 символический (на основе правил) 이며 나머지 하나는 신경망 (нейронная сеть) 이다. 근래의 연구는 대부분 신경망을 사용하고 있지만, символический метод 나은 일반화가 가능하다는 장점이 있다. 이러한 символический подход의 장점을 살려, программный синтез 를 위한 гибрид 모델인 PLANS를 본 논문에서는 제안하고 있다.

Вклад

  • Мы разрабатываем нейронную архитектуру для вывода спецификаций ввода-вывода из видео и кодирования задачи синтеза в готовый решатель на основе правил.
  • Мы решаем ключевую проблему, заключающуюся в том, чтобы сделать решатель на основе правил устойчивым к шуму на выходе сети, разработав алгоритм адаптивной фильтрации для спецификаций.
  • Мы оцениваем PLANS на тестах Karel и ViZDoom и демонстрируем значительное улучшение производительности по сравнению с современными сквозными нейронными архитектурами, несмотря на использование строго меньшего количества контрольных сигналов.

Задача: Синтез программы из разнородных демонстрационных видеороликов.

본 задача 는 Взаимодействие агента со средой 에 기반하여 политика агента (программа) 을 конструкция 하는 연구이다. Agent는 이산적 time step에 따라 환경과 상호작용한다고 가정하며, 유한한 수의 state와 action을 가지고 있다. Агент, состояние, действие, действие, состояние, детерминированная политика, переход, детерминированная политика.
는 восприятие을 가정한다. 이는 состояние에 대한 абстрактное представление이며 True 혹은 False의 값을 가진다.

ПЛАНЫ модель

Демо-кодировщик, многоуровневая конволюционная сеть, декодер, ваниль, seq2seq, декодер и т.д. основанный на правилах синтезатор или розетка, решатель или решатель z3.

Алгоритм фильтрации

Синтез 과정 중 Noise는 큰 영향을 끼친다. Алгоритм фильтрации, 신경 망의 예측 신뢰도를 사용한다. 주어진 tau마다 [0, 1]사이의 уровень уверенности в действиях값과 уровень уверенности в восприятии을 출력하고 두 값중 하나라도 너무 작으면 синтез과정에서 제외시킨다. 정적 필터링은 threshold값이 고정이지만, 동적 필터링은 과정을 거칠수록 임계값을 올리게 된다.

Результат

벤치마크로는 Karel과 VizDoom을 사용하였다.