Google criou uma “constituição” para robôs

Os robôs da DeepMind agora possuem um sistema que os torna seguros para humanos
(foto: Domínio Público CC0)

A equipe de robótica DeepMind do Google desenvolveu novos sistemas de IA que ajudarão os robôs a tomar decisões com mais rapidez e a realizar tarefas com mais eficiência e segurança quando cercados por humanos.

O sistema de aquisição de dados AutoRT usa um Modelo de Linguagem Visual (VLM) e um Modelo de Linguagem Grande (LLM) para ajudar os robôs a avaliar seu ambiente, adaptar-se a ambientes desconhecidos e tomar decisões ao executar tarefas. O VLM é utilizado para analisar o ambiente e reconhecer objetos no campo de visão do robô, enquanto o LLM é responsável pela execução de tarefas criativas.

A inovação mais importante do AutoRT é o aparecimento no bloco LLM de “Robot Constitution” – comandos orientados para a segurança que instruem a máquina a evitar a execução de tarefas relacionadas a pessoas, animais, objetos pontiagudos e até aparelhos elétricos, observa The Verge.

Para maior segurança, os robôs são programados para parar quando o esforço total exceder um determinado limite. Seu design agora possui um interruptor físico adicional que pode ser usado em caso de emergência.

Nos últimos sete meses, o Google implantou 53 robôs com o sistema AutoRT em quatro de seus edifícios de escritórios e realizou mais de 77 mil testes. Algumas das máquinas eram controladas remotamente por operadores, enquanto outras executavam tarefas de forma autônoma, seja com base em um algoritmo ou utilizando o modelo de IA Robotic Transformer (RT-2).

Até agora, todos esses robôs parecem extremamente simples: são membros manipuladores localizados sobre uma base móvel e equipados com câmeras para avaliar a situação.

A segunda inovação da DeepMind é o sistema SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers), que visa otimizar o trabalho do modelo RT-2. Os pesquisadores descobriram que quando os dados de entrada são duplicados, por exemplo, aumentando a resolução das câmeras, a necessidade de recursos computacionais do robô quadruplica. Este problema foi resolvido graças a um novo método de ajuste fino de IA chamado up-training.

O método transforma o aumento quadrático na necessidade de recursos computacionais em um aumento quase linear. Graças a isso, o modelo funciona mais rápido mantendo a mesma qualidade.

Finalmente, os engenheiros da DeepMind desenvolveram um modelo de IA chamado RT-Trajectory que facilita o treinamento de robôs para realizar tarefas específicas. Após definir a tarefa, o próprio operador demonstra um exemplo de sua implementação. O RT-Trajectory analisa a trajetória do movimento humano e a adapta às ações do robô.