A equipe de robótica DeepMind do Google desenvolveu novos sistemas de IA que ajudarão os robôs a tomar decisões com mais rapidez e a realizar tarefas com mais eficiência e segurança quando cercados por humanos.
O sistema de aquisição de dados AutoRT usa um Modelo de Linguagem Visual (VLM) e um Modelo de Linguagem Grande (LLM) para ajudar os robôs a avaliar seu ambiente, adaptar-se a ambientes desconhecidos e tomar decisões ao executar tarefas. O VLM é utilizado para analisar o ambiente e reconhecer objetos no campo de visão do robô, enquanto o LLM é responsável pela execução de tarefas criativas.
A inovação mais importante do AutoRT é o aparecimento no bloco LLM de “Robot Constitution” – comandos orientados para a segurança que instruem a máquina a evitar a execução de tarefas relacionadas a pessoas, animais, objetos pontiagudos e até aparelhos elétricos, observa The Verge.
Para maior segurança, os robôs são programados para parar quando o esforço total exceder um determinado limite. Seu design agora possui um interruptor físico adicional que pode ser usado em caso de emergência.
Nos últimos sete meses, o Google implantou 53 robôs com o sistema AutoRT em quatro de seus edifícios de escritórios e realizou mais de 77 mil testes. Algumas das máquinas eram controladas remotamente por operadores, enquanto outras executavam tarefas de forma autônoma, seja com base em um algoritmo ou utilizando o modelo de IA Robotic Transformer (RT-2).
Até agora, todos esses robôs parecem extremamente simples: são membros manipuladores localizados sobre uma base móvel e equipados com câmeras para avaliar a situação.
A segunda inovação da DeepMind é o sistema SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers), que visa otimizar o trabalho do modelo RT-2. Os pesquisadores descobriram que quando os dados de entrada são duplicados, por exemplo, aumentando a resolução das câmeras, a necessidade de recursos computacionais do robô quadruplica. Este problema foi resolvido graças a um novo método de ajuste fino de IA chamado up-training.
O método transforma o aumento quadrático na necessidade de recursos computacionais em um aumento quase linear. Graças a isso, o modelo funciona mais rápido mantendo a mesma qualidade.
Finalmente, os engenheiros da DeepMind desenvolveram um modelo de IA chamado RT-Trajectory que facilita o treinamento de robôs para realizar tarefas específicas. Após definir a tarefa, o próprio operador demonstra um exemplo de sua implementação. O RT-Trajectory analisa a trajetória do movimento humano e a adapta às ações do robô.