В качестве новаторской разработки Google представила свою последнюю модель искусственного интеллекта (ИИ) — Robotics Transformer 2 (RT2). В отличие от обычных моделей ИИ, которые превосходно справляются с такими задачами, как рисование изображений, RT2 представляет собой модель «видение-язык-действие» (VLA), которая выходит за рамки ограничений языковой обработки и совершает гигантский скачок в области робототехники. В этой статье рассматриваются возможности Google RT2 и их потенциальное значение для мира робототехники.

Что такое Robotics Transformer 2 (RT2)?

Google Robotics Transformer 2 (RT2) — это усовершенствованная модель VLA, способная обрабатывать как текст, так и изображения и преобразовывать их в действенные команды для роботов. В то время как традиционные языковые модели обучаются исключительно на текстовых данных для понимания общих концепций, RT2 выходит за рамки этого, извлекая знания из веб-данных и используя их для информирования о поведении роботов. По сути, RT2 может общаться с роботами, предоставляя им возможность понимать и выполнять задачи на основе текстового и визуального ввода.

От чат-ботов к роботам: прогресс в заземлении

Винсент Ванхоук, глава отдела робототехники в Google DeepMind, подчеркивает ключевое различие между чат-ботами и роботами с точки зрения обучения и понимания. В то время как чат-ботов можно обучать с помощью поступающей им информации по определенной теме, роботам требуется более глубокое понимание реального мира, процесс, известный как «заземление». Ванхук иллюстрирует эту концепцию простым примером с красным яблоком.

Проблема заземления в робототехнике

Чтобы понять концепцию красного яблока, чат-боту нужно просто объяснение. Однако для робота понимание красного яблока выходит за рамки базовой информации. Робот должен обладать всесторонними знаниями о яблоке, например, о его физических характеристиках, о том, чем оно отличается от аналогичных предметов (например, от красного шара), и о том, как его подобрать, не повредив. Такое сложное заземление имеет решающее значение для эффективного выполнения роботами различных реальных задач.

Уникальный подход RT2 к робототехнике