Framework позволяет человеку корректировать действия робота, используя обратную связь, которую он дал бы другому человеку

Framework позволяет человеку корректировать действия робота, используя обратную связь, которую он дал бы другому человеку
12:00, 11 Мар.

Представьте, что робот помогает вам мыть посуду. Вы просите его вытащить из раковины мыльную миску, но его захват немного промахивается. Используя новую структуру, разработанную исследователями MIT и NVIDIA, вы можете исправить поведение этого робота с помощью простых взаимодействий.

Метод позволит вам указать на миску или проследить траекторию к ней на экране, или просто подтолкнуть руку робота в нужном направлении.

Работа опубликована на сервере препринтов arXiv. В отличие от других методов исправления поведения робота, эта техника не требует от пользователей сбора новых данных и переобучения модели машинного обучения , которая питает мозг робота.

Она позволяет роботу использовать интуитивную обратную связь от человека в реальном времени, чтобы выбрать возможную последовательность действий, которая максимально соответствует намерению пользователя.

Когда исследователи протестировали свою структуру, ее успешность оказалась на 21% выше, чем у альтернативного метода, не предполагавшего вмешательства человека.

В долгосрочной перспективе эта структура может позволить пользователю легче управлять роботом, обученным на заводе, для выполнения широкого спектра домашних задач, даже если робот никогда не видел их дома или находящихся в нем предметов.

«Мы не можем ожидать, что неспециалисты будут выполнять сбор данных и тонкую настройку модели нейронной сети.

Потребитель будет ожидать, что робот будет работать сразу после установки, а если этого не произойдет, он захочет иметь интуитивно понятный механизм для его настройки.

Именно эту задачу мы и решили в этой работе», — говорит Феликс Яньвэй Ван, аспирант кафедры электротехники и информатики (EECS) и ведущий автор статьи arXiv .

Его соавторы — Лируй Ван, доктор философии и Илун Ду, старший автор Джули Шах, профессор аэронавтики и астронавтики Массачусетского технологического института и директор Группы интерактивной робототехники в Лаборатории компьютерных наук и искусственного интеллекта (CSAIL); а также Балакумар Сундаралингам, Сюнин Ян, Ю-Вэй Чао, Клаудия Перес-Д’Арпино, доктор философии и Дитер Фокс из NVIDIA.

Исследование будет представлено на Международной конференции по робототехнике и автоматизации.

Уменьшение несоосности Недавно исследователи начали использовать предварительно обученные генеративные модели ИИ для изучения «политики» или набора правил, которым следует робот для выполнения действия.

Генеративные модели могут решать множество сложных задач.

Во время обучения модель видит только возможные движения робота, поэтому она учится генерировать допустимые траектории, по которым должен следовать робот.

Хотя эти траектории верны, это не значит, что они всегда совпадают с намерениями пользователя в реальном мире. Робота могли обучить хватать коробки с полки, не опрокидывая их, но он может не дотянуться до коробки на чьей-то книжной полке, если полка ориентирована не так, как он видел при обучении.

Чтобы преодолеть эти сбои, инженеры обычно собирают данные, демонстрирующие новую задачу, и заново обучают генеративную модель.

Это дорогостоящий и трудоемкий процесс, требующий опыта в области машинного обучения. Вместо этого исследователи Массачусетского технологического института хотели позволить пользователям управлять поведением робота во время развертывания, если он совершает ошибку.

Но если человек взаимодействует с роботом, чтобы исправить его поведение, это может непреднамеренно привести к тому, что генеративная модель выберет недопустимое действие.

Она может добраться до нужной пользователю коробки, но при этом сбросить книги с полки.

«Мы хотим позволить пользователю взаимодействовать с роботом, не допуская подобных ошибок, поэтому мы получаем поведение, которое гораздо больше соответствует намерениям пользователя во время развертывания, но которое также является допустимым и осуществимым», — говорит Ван.

Их фреймворк достигает этого, предоставляя пользователю три интуитивно понятных способа корректировки поведения робота, каждый из которых имеет определенные преимущества.

Во-первых, пользователь может указать на объект, которым он хочет, чтобы робот манипулировал, в интерфейсе, который показывает вид с его камеры.

Во-вторых, он может проследить траекторию в этом интерфейсе, что позволяет ему указать, как он хочет, чтобы робот достиг объекта.

В-третьих, он может физически переместить руку робота в направлении, в котором он хочет, чтобы он следовал. «Когда вы сопоставляете двухмерное изображение окружающей среды с действиями в трехмерном пространстве, часть информации теряется.

Физическое подталкивание робота — это самый прямой способ указать намерение пользователя без потери какой-либо информации», — говорит Ван.

Выборка для успеха Чтобы гарантировать, что эти взаимодействия не заставят робота выбрать недопустимое действие, например, столкновение с другими объектами, исследователи используют специальную процедуру выборки.

Эта техника позволяет модели выбирать действие из набора допустимых действий, которое наиболее точно соответствует цели пользователя.

«Вместо того чтобы просто навязывать волю пользователя, мы даем роботу представление о намерениях пользователя, но позволяем процедуре выборки колебаться вокруг его собственного набора усвоенных моделей поведения», — объясняет Ван.

Этот метод выборки позволил исследовательской платформе превзойти другие методы, с которыми они ее сравнивали во время моделирования и экспериментов с настоящей роботизированной рукой на игрушечной кухне.

Хотя их метод не всегда позволяет сразу выполнить задачу, он дает пользователям преимущество в том, что они могут немедленно исправить робота, если видят, что он делает что-то неправильно, вместо того, чтобы ждать, пока он закончит, а затем давать ему новые инструкции.

Более того, после того, как пользователь несколько раз подтолкнет робота, пока он не возьмет правильную миску, он может зарегистрировать это корректирующее действие и включить его в свое поведение посредством будущего обучения.

Затем, на следующий день, робот сможет взять правильную миску без необходимости подталкивания.

«Но ключом к этому постоянному совершенствованию является предоставление пользователю возможности взаимодействовать с роботом, что мы здесь и продемонстрировали», — говорит Ван.

В будущем исследователи хотят повысить скорость процедуры отбора проб, сохранив или улучшив ее производительность.

Они также хотят поэкспериментировать с генерацией политики робота в новых условиях.

Рубрика: Гаджеты и Технологии. Читать весь текст на android-robot.com.

 

Подробное исследование и описание мотор-приводов для гидравлических тележек и сопутствующего оборудования для оптимизации работы складов

Мотор-приводы для гидравлических тележек играют важную роль в современном складском хозяйстве и логистических операциях. Эти устройства ...

Что такое квази-кэш по карте Владелец банковской платежной карты (БПК) часто не знает всех комиссий банка. Например, клиент совершив онлайн-перевод, обнаруживает, что с его счета...

Регистрируйся и получай подарки от ООО «Газпром энергосбыт Брянск» Филиал «Брянскэнергосбыт» ООО «Газпром энергосбыт Брянск» запускает акцию «Регистрируйся и получай подарок!» для бытовых абонентов, которые еще не ус...

В женский дресс-код Уимблдона впервые за 146 лет внесли изменения Одно из главных событий в мире большого тенниса - Уимблдонский турнир впервые за 146 лет изменил свой строгий дресс-код. В 2023 г. администрация турн...

Еврокубок. «Вулвз» – «Венеция», «Бешикташ» играет с «Лондон Лайонс» и другие матчи В среду, 15 ноября, в рамках регулярного чемпионата Еврокубка пройдут пять матчей. Литовский клуб «Вулвз» примет итальянскую «Венецию», турецкий «Беш...

Онлайн Покупки Одежды и Экономия Денег с Промокодами

Современные технологии сделали покупки одежды онлайн удобными и доступными. Однако, чтобы еще больше наслаждаться своим шопингом, стоит обратить в...

Проверка Авто на Арест: Важные Шаги для Безопасности и Уверенности

При покупке подержанного автомобиля важно уделять внимание не только его техническому состоянию, но и юридическим аспектам. Один из ключевых момен...

Инновационные смазочные материалы: Эволюция в мире автомобильной и внедорожной техники

Современные технологии не останавливаются на месте, и это касается не только двигателей и систем управления автомобилей, но и смазочных материалов...

Константин Струков и умение принимать профессиональные решения

От горного мастера до миллиардера: трудовая биография Струкова, владельца "Южуралзолота"

История успеха часто начинается с момента упорно...

Дизайн Ванной Комнаты: Творчество и Комфорт в Каждой Детали

1. Введение

Ванная комната – это не просто функциональное пространство, но и уголок для релаксации и творчества. Проектирование...

Время Намаза в Городе Нальчик: Руководство для Верующих

1. Пятикратные Молитвы в Исламе

Молитвы в исламе являются одним из важных аспектов веры. Верующим предписано совершать пятикрат...

Аренда Яхты в Мармарисе Исследуйте Красоты Эгейского Побережья

1. Почему Мармарис?

Мармарис, расположенный на юго-западе Турции, является идеальным местом для аренды яхты и морских приключений:

Бетон, строительные смеси, цемент

Бетон: основные свойства и применение

Бетон - один из основных строительных материалов, широко применяемый в различных отраслях...

Имплантация зубов: восстановление красоты и функциональности улыбки

1. Что такое имплантация зубов?