В Физтехе научили четвероногого робота ходить, используя принципы биологического мозга

Ученые из лаборатории нейробиоморфных технологий МФТИ совместно с коллегами из Университета Лобачевского разработали четвероногого робота, который умеет ходить симметричной походкой, удерживать равновесие на сложных поверхностях и принимать решения в реальном времени благодаря встроенному нейропроцессору и алгоритмам обучения с подкреплением.
Шагающие роботы давно привлекают внимание исследователей. В отличие от колесных или гусеничных собратьев, они способны перемещаться по пересеченной местности, подниматься по лестницам и работать в тесных пространствах, куда не проедет ни одна машина на колесах.
Основой для разработки послужила платформа SpotMicro — доступная для экспериментов «домашняя» версия четвероногого робота, напечатанная на 3D‑принтере, которую авторы наполнили совершенно новым интеллектуальным содержанием.
Робот состоит из корпуса и четырех ног, каждая из которых имеет три сустава: как бедро, голень и стопа у животного. Всего — 12 управляемых степеней свободы, и каждая из них требует точного и синхронного контроля. Корпус отпечатан из легких полимерных материалов, подшипники в шарнирах минимизируют трение, а мягкие накладки на «лапах» обеспечивают сцепление с поверхностью. Центр масс рассчитан так, чтобы робот оставался устойчивым даже при активном движении.
Авторы выстроили трехуровневую систему управления движением. На верхнем уровне генератор походки формирует плавные траектории шага с помощью кривых Безье — математических кривых, которые дизайнеры используют в графическом редакторе, а здесь они определяют, как именно «лапа» поднимается, переносится вперед и мягко опускается на землю. Средний уровень решает задачу обратной кинематики: зная, куда должна встать нога, система вычисляет, на какой угол повернуть каждый из трех суставов. Наконец, нижний уровень управляет сервоприводами с частотой 100 Гц — сотня команд в секунду, чтобы робот мог мгновенно реагировать на изменения рельефа.
Для обучения с подкреплением ученые использовали физический симулятор PyBullet, в котором виртуальная копия робота пробует различные движения, получает «награды» за успешное продвижение вперед и «штрафы» за раскачивание и падения.
«Мы хотели показать, что даже на относительно недорогой открытой платформе можно реализовать современные подходы к управлению. При этом энергозатраты существенно ниже, а это критично для автономного робота, работающего от аккумулятора», — рассказал один из разработчиков, научный сотрудник лаборатории нейробиоморфных технологий МФТИ Артем Губа.
Ключевым этапом стал перенос обученных алгоритмов из виртуального мира в реальный. Разрыв между симуляцией и физическим роботом — одна из главных проблем в робототехнике: в виртуальной среде нет шума датчиков, люфтов сервоприводов и непредсказуемого трения. Авторы применили рандомизацию динамики во время виртуальной тренировки: случайным образом изменяли массу робота, параметры трения и характеристики моторов, чтобы нейросеть привыкла к разбросу условий. Дополнительно использовали фильтр Калмана и медианную фильтрацию для подавления шумов реальных инерциальных датчиков.
Мозгом робота стала плата Orange Pi 5B на базе чипа Rockchip RK3588S, оснащенная интегрированным нейропроцессором (Neural Processing Unit, NPU) — специализированным аппаратным ускорителем, заточенным под задачи искусственного интеллекта: распознавание объектов, обработку изображений с камеры, оптимизацию траекторий движения.
«Нейропроцессор — это как мозжечок для нашего робота. Он разгружает основной процессор и берет на себя самые вычислительно емкие задачи. Без него пришлось бы использовать более мощное и более энергоемкое оборудование, а значит — тяжелый аккумулятор, больший вес, меньшую автономность. NPU позволяет удерживать все в рамках компактного и легкого корпуса», — пояснил научный сотрудник лаборатории нейробиоморфных технологий МФТИ Иннокентий Кастальский.
Результаты экспериментов на реальном роботе подтвердили эффективность обучения. После 400 тысяч шагов точность управления достигла 95 %.
«Наша главная идея — использовать принципы работы биологического мозга для управления роботом. Импульсные нейронные сети — это не просто еще один инструмент машинного обучения, это мост между нейронаукой и робототехникой. Мы не копируем мозг буквально, но заимствуем его ключевые механизмы: импульсную передачу сигналов, экономичность вычислений, способность к быстрой адаптации. Когда такая сеть работает на нейроморфном ускорителе, мы получаем систему, которая приближается к биологической эффективности», — отметил заведующий лабораторией нейробиоморфных технологий МФТИ Виктор Казанцев.
Ценность работы — в объединении нескольких технологий, которые прежде развивались по отдельности. Открытая платформа SpotMicro, импульсные нейросети, обучение с подкреплением в физическом симуляторе, перенос алгоритмов на реального робота и аппаратное ускорение на нейропроцессоре — все это собрано в единую, целостную систему. Авторы не только предложили архитектуру управления, но и провели полноценный цикл: от математической модели кинематики до демонстрации на физическом устройстве.
Четвероногие роботы с автономным управлением востребованы в поисково-спасательных операциях, в которых нужно перемещаться по завалам и обломкам; в мониторинге природной среды; в охранных системах и при обследовании промышленных объектов. Модульная конструкция позволяет наращивать сенсорное оснащение — добавлять лидары, тепловизоры, манипуляторы. А относительная дешевизна платформы делает возможным массовое использование подобных роботов.
В ближайших планах команды — интеграция более сложных моделей машинного обучения, совершенствование сенсорной системы для полноценной автономной навигации и реализация дополнительных режимов передвижения: бега, галопа, ползания. Исследователи также рассчитывают масштабировать результаты на более крупные роботизированные платформы, где нейроморфные методы управления раскроют свой потенциал в полной мере.
Источник: Официальный ресурс Министерства образования и науки Российской Федерации