Уявіть собі робота-собаку, який не тільки виконує команди, але й може грати з вами в “апорт”. Це вже не фантастика, а реальність, завдяки новій системі комп’ютерного зору Clio, розробленій вченими з MIT.
Clio: інтелект і комп’ютерний зір
Clio дозволяє роботам швидко аналізувати навколишнє середовище за допомогою камер і визначати об’єкти, які найбільше відповідають поставленому завданню. Система використовує теорію “інформаційного вузького місця”, стискаючи інформацію та виділяючи лише найважливіші деталі.
Робот Spot в дії
Щоб продемонструвати можливості Clio, вчені використали робота-собаку Spot від Boston Dynamics. Spot, оснащений Clio, зміг досліджувати офісну будівлю і виконувати різні завдання, наприклад, знаходити певні предмети.
Як працює Clio?
Clio поєднує в собі великі мовні моделі (LLM) та комп’ютерний зір. LLM дозволяють роботу розуміти голосові команди, а комп’ютерний зір – аналізувати зображення і виділяти потрібні об’єкти. Clio розбиває зображення на сегменти і вибирає ті, які семантично схожі, тобто відповідають завданню.
Майбутнє Clio
Вчені планують розвивати Clio, щоб роботи могли виконувати більш складні завдання, наприклад, пошук людей в надзвичайних ситуаціях або відновлення електропостачання.
Clio – це важливий крок у розвитку штучного інтелекту та робототехніки. Ця система дозволяє роботам краще розуміти світ навколо і виконувати складні завдання. Можливо, вже незабаром ми побачимо роботів-собак, які гратимуть з нами в “апорт” в парку.
Читайте також: До 2040 року роботів-гуманоїдів буде більше, ніж людей