O SynthID será lançado na plataforma Imagen do Google, mas poderá ser lançado para terceiros posteriormente.
O Google deu um passo em direção à transparência nas imagens geradas por IA. O Google DeepMind anunciou o SynthID, uma ferramenta de marca d’água/identificação para arte generativa.
A empresa afirma que a tecnologia incorpora uma marca d’água digital, invisível ao olho humano, diretamente nos pixels de uma imagem. SynthID está sendo lançado primeiro para “um número limitado” de clientes usando Imagen, o gerador de arte do Google disponível em seu conjunto de ferramentas de IA baseadas em nuvem.
Um dos muitos problemas da arte generativa – para além das implicações éticas da formação do trabalho dos artistas – é o potencial para criar deepfakes. Por exemplo, o novo traje de hip-hop do Papa (uma imagem de IA criada com MidJourney) que se tornou viral nas redes sociais foi um dos primeiros exemplos do que poderia tornar-se mais mundano à medida que as ferramentas generativas evoluíssem.
Não é preciso muita imaginação para ver como algo como anúncios políticos usando arte gerada por IA poderia causar muito mais danos do que uma imagem engraçada circulando no Twitter.
“Marca d’água em conteúdo áudio e visual para ajudar a esclarecer que todo o conteúdo é gerado por inteligência artificial” foi um dos compromissos voluntários que sete empresas de inteligência artificial concordaram em desenvolver após uma reunião em julho na Casa Branca. O Google é a primeira empresa a lançar tal sistema.
O Google não vai muito longe na implementação técnica do SynthID (presumivelmente para evitar soluções alternativas), mas diz que a marca d’água não pode ser facilmente removida por técnicas simples de edição. “É difícil encontrar o equilíbrio certo entre imperceptibilidade e robustez na manipulação de imagens”, escreveu a empresa em uma postagem no blog DeepMind.
A imagem não será comprometida
“Projetamos o SynthID para que não comprometa a qualidade da imagem e permita que a marca d’água permaneça detectável, mesmo após modificações como adição de filtros, alteração de cores e salvamento com diferentes esquemas de compactação com perdas – mais comumente usados para JPEG”, escreveram eles por SynthID da DeepMind líderes do projeto Sven Gowal e Pushmeet Kohli.
A parte de identificação do SynthID avalia a imagem com base em três níveis de confiança da marca d’água digital: detectada, não detectada e possivelmente detectada. Como a ferramenta está incorporada nos pixels da imagem, o Google afirma que seu sistema pode funcionar junto com abordagens baseadas em metadados, como a que a Adobe usa com seus recursos geradores do Photoshop, atualmente disponíveis em versão beta aberta.
SynthID inclui um par de modelos de aprendizagem profunda: um para marca d’água e outro para identificação. O Google diz que os dois treinaram em várias imagens, culminando em um modelo combinado de ML.
“O modelo combinado é otimizado para uma série de objetivos, incluindo a identificação correta do conteúdo com marca d’água e a melhoria da imperceptibilidade, alinhando visualmente a marca d’água com o conteúdo original”, escreveram Gowal e Kohli.
O Google reconheceu que não é uma solução perfeita, acrescentando que “não é segura contra manipulações extremas de imagens”. Mas descreve a marca d’água como “uma abordagem técnica promissora para capacitar pessoas e organizações a trabalhar de forma responsável com conteúdo gerado por IA”. A empresa afirma que a ferramenta pode se estender a outros modelos de IA, incluindo aqueles encarregados de gerar texto (como ChatGPT), vídeo e áudio.
Embora as marcas d’água possam ajudar com deepfakes, é fácil imaginar as marcas d’água digitais se transformando em uma corrida armamentista com os hackers, com os serviços que adotam o SynthID exigindo atualização constante.
Além disso, a natureza de código aberto do Stable Diffusion, uma das principais ferramentas generativas, pode tornar a adoção do SynthID ou qualquer solução semelhante em todo o setor um grande problema: ele já possui inúmeras versões personalizadas que podem ser executadas em computadores locais. Independentemente disso, o Google espera disponibilizar o SynthID a terceiros “num futuro próximo” para, pelo menos, melhorar a transparência da IA em todo o setor.