Фахівці компанії Nvidia з Сіетла, США, зробили ще один крок на шляху до створення повноцінних розумних роботів. Зазвичай промислові роботи функціонують тільки в рамках програми, проте розробники створили робота, який спостерігає за людиною і вчиться на його прикладі.
Що відомо
У дослідах використовувався промисловий робот Бакстер (Baxter), оскільки його руки можуть виконувати ті ж функції, що і руки людини. За керування відповідали нейромережі і «словник», який дозволяв описувати те, що відбувається навколо.
Як зазначається, нейромережі ґрунтуються на демонстрації та спостереження за навколишнім середовищем. Вони генерують програму, яка потім виконується роботом. При цьому машина враховує відношення між об’єктами. Зокрема, робот «розуміє», що, якщо прибрати кубик знизу, вся конструкція зруйнується, вміє планувати дії і так далі. При цьому навчання нейромереж проводиться в віртуальної симуляції, а в реальності лише тестується готове рішення.
Як заявив Дітер Фокс, голова відділу розробки робототехніки в Nvidia і професор Вашингтонського університету, команда має намір створити робота, який буде працювати близько до людини і при цьому безпечно. Для цього потрібно навчити роботів відрізняти людей від навколишнього середовища, стежити за їх діяльністю і розуміти, коли від них потрібна допомога. Такі машини можуть згодитися на невеликих виробництвах і в приватних будинках, особливо серед людей з обмеженими можливостями. Вміння адаптуватися до нових ситуацій і можливість роботи без оператора можуть зробити таких роботів повністю автономними.
Як це працює
Дітер Фокс зазначає, що нейромережі вже навчилися працювати з комп’ютерними іграми, але для реальності це не підходить. Тут можна вчитися на помилках, потрібно планування і облік наслідків. Тому завданням команди було натренувати нейромережа в точності слідувати прикладу людини, а якщо відбувається непередбачене відхилення від такої програми — розуміти, що сталася помилка, і намагатися її вирішити.
Поки що нейромережі в Бакстере використовуються лише для виявлення відмінностей в кубиках кольором і формою і повторення за людиною. Таке може зробити трирічна дитина, але для робототехніки це важливий крок у спробі створити універсального робота.
При цьому робот поки ще нерідко помиляється, хоча вже вдалося довести його до того рівня, коли він повторює дії після всього лише однієї демонстрації.
Для тренування нейромереж команда в основному використовувала синтетичні дані з симулированной середовища. Враховуючи швидкість переміщення руки робота, в реальному світі мереж довелося б вчитися роками, не кажучи вже про те, що можна зламати машину. Стен Берчфілд, який вів цей проект, каже, що створення наближених до реального світу вільних симуляцій, в яких алгоритми можуть вчитися на своїх помилках, — єдиний спосіб досить швидкісного самонавчання роботів. Тому Nvidia і займається цією розробкою: компанії здається, що їх залізо ідеально підходить для виконання таких завдань. Важливим компонентом тренувань є візуальний аспект. Машини повинні розуміти, як виглядає людина, і чим один від одного відрізняються ті об’єкти, над якими належить працювати. Досвід Nvidia у створенні обладнання та софта, що працює з графікою, за словами Берчфілда, тут незамінний.
Зараз команда займається створенням більш фотореалістичних симуляцій, щоб нейросетям простіше давався перехід в реальний світ, і розширює обсяг завдань, які вони можуть запам’ятати.
Що це дасть
Важливо розуміти, що подібні технології потрібні не тільки для універсальних роботів майбутнього. Вони знайдуть застосування в автопилотах автомобілів, які будуть «спілкуватися» один з одним і накопичувати досвід. Також це стосується персональної електроніки для налаштування персоналізованих помічників.