Em 8 de agosto, o Google DeepMind acessou a plataforma de mídia social X (anteriormente conhecida como Twitter) para compartilhar insights sobre seu mais recente projeto de pesquisa envolvendo um sistema robótico projetado para jogar tênis de mesa.
O Google DeepMind é um importante laboratório de pesquisa em inteligência artificial (IA) que opera sob o guarda-chuva da Alphabet Inc., empresa controladora do Google. Foi formado pela fusão de duas equipes líderes em IA: o Google Brain e a equipe original do DeepMind. Esse esforço combinado impulsionou o Google DeepMind para a vanguarda da inovação em IA, com foco no desenvolvimento de sistemas avançados de IA que podem enfrentar alguns dos desafios científicos e de engenharia mais complexos.
A DeepMind foi fundada inicialmente em 2010 com uma forte ênfase em aprendizado por reforço profundo, um método que combina aprendizado profundo com aprendizado por reforço. O laboratório ganhou ampla atenção com a criação do AlphaGo, o primeiro sistema de IA a derrotar um campeão mundial no jogo de Go, um feito que foi considerado uma década à frente de seu tempo. Esse sucesso levou a mais avanços em IA, incluindo o desenvolvimento do AlphaFold, uma IA que prevê modelos 3D de estruturas de proteínas com precisão notável, revolucionando o campo da biologia.
Em 2023, o Google fundiu suas divisões de pesquisa de IA para formar o Google DeepMind, visando unificar esforços e acelerar o progresso em IA. Um de seus projetos mais recentes é o Gemini, um modelo de IA de última geração que supostamente supera alguns modelos de IA existentes, como o GPT-4, em benchmarks específicos.
De acordo com o tópico do Google Deepmind no X, o tênis de mesa tem sido usado há muito tempo como referência em pesquisa de robótica devido à combinação única do esporte de movimento físico de alta velocidade, tomada de decisão estratégica e precisão. Desde a década de 1980, pesquisadores têm utilizado o jogo como um banco de testes para desenvolver e refinar habilidades robóticas, tornando-o um candidato ideal para a mais recente exploração orientada por IA do Google DeepMind.
Para treinar o robô de tênis de mesa, o Google DeepMind começou reunindo um conjunto de dados abrangente de estados iniciais da bola. Esse conjunto de dados incluía parâmetros críticos como posição, velocidade e giro da bola, que são essenciais para entender e prever trajetórias da bola durante uma partida. Ao praticar com essa extensa biblioteca de dados, o robô conseguiu desenvolver uma gama de habilidades necessárias para o tênis de mesa, incluindo topspin de forehand, direcionamento de backhand e a capacidade de devolver saques.
O processo de treinamento ocorreu inicialmente em um ambiente simulado, o que permitiu que o robô praticasse em um ambiente controlado que modelava com precisão a física do tênis de mesa. Uma vez que o robô demonstrou proficiência no ambiente simulado, ele foi implantado em cenários do mundo real onde jogou contra oponentes humanos. Essa prática do mundo real gerou dados adicionais, que foram então realimentados na simulação para refinar ainda mais as habilidades do robô, criando um loop de feedback contínuo entre a simulação e a realidade.
Uma das principais inovações neste projeto é a capacidade do robô de se adaptar a diferentes oponentes. O Google DeepMind projetou o sistema para rastrear e analisar o comportamento e o estilo de jogo de seus adversários humanos, como para qual lado da mesa eles preferiam devolver a bola. Essa capacidade permitiu que o robô experimentasse várias técnicas, monitorasse sua eficácia e ajustasse sua estratégia em tempo real, semelhante a como um jogador humano pode alterar as táticas com base nas tendências de seu oponente.
Durante a pesquisa, o robô foi colocado contra 29 oponentes humanos com níveis de habilidade variados, variando de iniciantes a jogadores avançados. O desempenho do robô foi avaliado nesses diferentes níveis e, no geral, ele ficou no meio dos participantes, indicando que ele opera no nível de um amador intermediário. No entanto, quando confrontado com jogadores mais avançados, o robô encontrou limitações. O Google DeepMind reconheceu que o robô não foi capaz de vencer consistentemente jogadores avançados, citando fatores como velocidade de reação, capacidades de detecção de câmera, manuseio de giro e os desafios de modelar com precisão a borracha da raquete em simulações como fatores contribuintes.
O Google DeepMind concluiu seu tópico refletindo sobre as implicações mais amplas deste trabalho. Eles destacaram como esportes como tênis de mesa fornecem um ambiente rico para testar e desenvolver capacidades robóticas. Assim como os humanos podem aprender a executar tarefas complexas que exigem habilidade física, percepção e tomada de decisão estratégica, os robôs também podem, desde que tenham o treinamento certo e sistemas adaptativos em vigor. Esta pesquisa não apenas avança o campo da robótica, mas também oferece insights sobre como as máquinas podem ser treinadas para lidar com tarefas intrincadas do mundo real, potencialmente abrindo caminho para futuras inovações em IA e robótica.
Imagem em destaque via Pixabay