Como Projetos de Inteligência Artificial Generativa que usam grandes modelos de linguagem (LLMs) transitam do estágio experimental ao uso diário, surgiu a necessidade urgente de tecnologias escaláveis, seguras e com eficiência energética. Para dar suporte a esses modelos fundamentais e cargas de trabalho de IA, a IBM revelou um processador e acelerador para aprimorar a IA em escala empresarial.
Em agosto de 2021, a IBM anunciou os microprocessadores Telum, projetados especificamente para os computadores mainframe Z da IBM. O Telum foi o primeiro processador da IBM a integrar recursos de IA diretamente no hardware, melhorando a velocidade de processamento e a detecção de fraudes. Agora, a IBM revelou as especificações para seu próximo Telum II Processor e Spyre Accelerator, projetados para melhor capacidade de processamento em sistemas IBM Z de próxima geração que alavancam IA em modelos tradicionais e LLMs.
A Samsung Foundry fabricará o processador Telum II e o IBM Spyre Accelerator usando sua tecnologia de nó de 5 nm. Eles podem potencialmente melhorar o desempenho “em até 70% nos principais componentes do sistema”. Esses chips são alimentados por oito núcleos de alto desempenho que rodam a 5,5 GHz, aumentando a frequência e a capacidade de memória com um crescimento de 40% no cache. O hardware também suporta níveis de cache mais altos, L3 e L4, expandindo para 360 MB e 2,88 GB, respectivamente.
Óculos Snap de quinta geração: realidade aumentada redefinida: IBM anuncia processadores Telum II, LLM de upscaling e IA generativa
O Telum II da IBM possui unidades aceleradoras integradas
Comparado ao seu antecessor, as principais integrações do Telum II são aceleradores como a unidade de aceleração IO e o IBM Spyre Accelerator. A nova Unidade de Processamento de Dados (DPU) no chip do processador Telum II simplifica as operações do sistema e melhora o desempenho do componente. Além disso, o chip Spyre Accelerator auxilia o Telum II no cálculo de várias possibilidades e exibe resultados mais precisos do que seus companheiros.
Com cada chip acelerador conectado por meio de um adaptador PCIe de 75 watts e os poderes computacionais combinados, espera-se que os aceleradores atinjam 24 trilhões de operações por segundo (TOPS).
“Nosso roteiro robusto e multigeracional nos posiciona para permanecer à frente da curva em tendências tecnológicas, incluindo demandas crescentes de IA”, disse Tina Tarquinio, Product Management, IBM Z. “O Telum II Processor e o Spyre Accelerator são projetados para fornecer soluções de computação empresarial de alto desempenho, seguras e com maior eficiência energética. Após anos em desenvolvimento, essas inovações serão introduzidas em nossa plataforma IBM Z de próxima geração para que os clientes possam alavancar LLMs e IA generativa em escala.”
PlayStation 5 Pro oferece renderização 45% mais rápida com suporte para jogabilidade 8K: IBM anuncia processadores Telum II, LLM de upscaling e IA generativa
O processador Telum II e o Spyre Accelerator utilizam vários modelos de IA para melhor aplicar casos de uso de IA generativa. Por exemplo, detecção de fraude em reivindicações de seguro, combate à lavagem de dinheiro ou assistência de IA em atividades cotidianas, como transferência de conhecimento ou explicação de código.
A IBM revelou que o Telum II será o processador principal que alimentará as plataformas IBM Z. O Telum II e o Spyre Accelerator devem estar disponíveis em 2025.