GEN-1: новая роботизированная модель от Generalist с 99% надёжности для сложных задач

Компания Generalist, специализирующаяся на робототехнике и машинном обучении, представила новую физическую ИИ-систему GEN-1. Разработчики утверждают, что она достигла «производственных уровней успеха» в широком спектре физических навыков, которые раньше требовали ловкости и мышечной памяти человеческих рук. Система также способна реагировать на сбои, импровизируя новые движения и «соединяя идеи из разных областей для решения новых проблем».

От концепции к реальности

GEN-1 построена на основе предыдущей модели GEN-0, представленной в ноябре как доказательство концепции применимости законов масштабирования в обучении роботов. Модель показала, что увеличение объёма предварительных данных и вычислительного времени улучшает результаты после обучения. Однако, в отличие от больших языковых моделей, которые обучаются на триллионах слов из интернета, роботизированные системы не имеют такого же легкодоступного источника качественных данных о том, как люди манипулируют объектами.

Как собирали данные для обучения

Для решения этой проблемы Generalist использовала «data hands» — набор носимых захватов, которые фиксируют микродвижения и визуальную информацию, пока человек выполняет ручные задачи. Компания заявляет, что собрала уже более полумиллиона часов и «петабайты данных о физическом взаимодействии» для обучения своей физической модели.

Что умеет GEN-1

В результате получилась автономная система, достаточно точная, чтобы положить деньги в кошелёк, и достаточно адаптивная, чтобы складывать бельё или сортировать автозапчасти. Согласно данным Generalist, модель демонстрирует 99% успеха в выполнении повторяющихся, но деликатных механических задач, таких как складывание коробок, упаковка телефонов и обслуживание роботов-пылесосов, причём примерно в три раза быстрее, чем предыдущая модель GEN-0. По словам компании, GEN-1 достигает этих показателей после всего около часа адаптации своего предварительного обучения под «роботизированные данные», применимые к конкретному физическому воплощению робота.

Исправление ошибок на ходу

В прошлом сложные роботизированные системы обычно полагались на тщательно запрограммированные движения или были обучены выполнению исключительно одной задачи с небольшими вариациями. По мнению разработчиков, ключевое отличие GEN-1 — способность единой модели импровизировать на основе предыдущего опыта и естественно реагировать на сбои, даже когда они «выходят далеко за пределы данных обучения».