Como Projetos de Inteligência Artificial Generativa que usam grandes modelos de linguagem (LLMs) transitam do estágio experimental ao uso diário, surgiu a necessidade urgente de tecnologias escaláveis, seguras e com eficiência energética. Para dar suporte a esses modelos fundamentais e cargas de trabalho de IA, a IBM revelou um processador e acelerador para aprimorar a

Como Projetos de Inteligência Artificial Generativa que usam grandes modelos de linguagem (LLMs) transitam do estágio experimental ao uso diário, surgiu a necessidade urgente de tecnologias escaláveis, seguras e com eficiência energética. Para dar suporte a esses modelos fundamentais e cargas de trabalho de IA, a IBM revelou um processador e acelerador para aprimorar a IA em escala empresarial.

Em agosto de 2021, a IBM anunciou os microprocessadores Telum, projetados especificamente para os computadores mainframe Z da IBM. O Telum foi o primeiro processador da IBM a integrar recursos de IA diretamente no hardware, melhorando a velocidade de processamento e a detecção de fraudes. Agora, a IBM revelou as especificações para seu próximo Telum II Processor e Spyre Accelerator, projetados para melhor capacidade de processamento em sistemas IBM Z de próxima geração que alavancam IA em modelos tradicionais e LLMs.

A Samsung Foundry fabricará o processador Telum II e o IBM Spyre Accelerator usando sua tecnologia de nó de 5 nm. Eles podem potencialmente melhorar o desempenho “em até 70% nos principais componentes do sistema”. Esses chips são alimentados por oito núcleos de alto desempenho que rodam a 5,5 GHz, aumentando a frequência e a capacidade de memória com um crescimento de 40% no cache. O hardware também suporta níveis de cache mais altos, L3 e L4, expandindo para 360 MB e 2,88 GB, respectivamente.

Óculos Snap de quinta geração: realidade aumentada redefinida: IBM anuncia processadores Telum II, LLM de upscaling e IA generativa

O Telum II da IBM possui unidades aceleradoras integradas

Comparado ao seu antecessor, as principais integrações do Telum II são aceleradores como a unidade de aceleração IO e o IBM Spyre Accelerator. A nova Unidade de Processamento de Dados (DPU) no chip do processador Telum II simplifica as operações do sistema e melhora o desempenho do componente. Além disso, o chip Spyre Accelerator auxilia o Telum II no cálculo de várias possibilidades e exibe resultados mais precisos do que seus companheiros.

Com cada chip acelerador conectado por meio de um adaptador PCIe de 75 watts e os poderes computacionais combinados, espera-se que os aceleradores atinjam 24 trilhões de operações por segundo (TOPS).

“Nosso roteiro robusto e multigeracional nos posiciona para permanecer à frente da curva em tendências tecnológicas, incluindo demandas crescentes de IA”, disse Tina Tarquinio, Product Management, IBM Z. “O Telum II Processor e o Spyre Accelerator são projetados para fornecer soluções de computação empresarial de alto desempenho, seguras e com maior eficiência energética. Após anos em desenvolvimento, essas inovações serão introduzidas em nossa plataforma IBM Z de próxima geração para que os clientes possam alavancar LLMs e IA generativa em escala.”

Chip de processador Weapon II da IBM

PlayStation 5 Pro oferece renderização 45% mais rápida com suporte para jogabilidade 8K: IBM anuncia processadores Telum II, LLM de upscaling e IA generativa

O processador Telum II e o Spyre Accelerator utilizam vários modelos de IA para melhor aplicar casos de uso de IA generativa. Por exemplo, detecção de fraude em reivindicações de seguro, combate à lavagem de dinheiro ou assistência de IA em atividades cotidianas, como transferência de conhecimento ou explicação de código.

A IBM revelou que o Telum II será o processador principal que alimentará as plataformas IBM Z. O Telum II e o Spyre Accelerator devem estar disponíveis em 2025.

Atualizado em by Joan Paris
Como Projetos de Inteligência Artificial Generativa que usam grandes modelos de linguagem (LLMs) transitam do estágio experimental ao uso diário, surgiu a necessidade urgente de tecnologias escaláveis, seguras e com eficiência energética. Para dar suporte a esses modelos fundamentais e cargas de trabalho de IA, a IBM revelou um processador e acelerador para aprimorar a
Como Projetos de Inteligência Artificial Generativa que usam grandes modelos de linguagem (LLMs) transitam do estágio experimental ao uso diário, surgiu a necessidade urgente de tecnologias escaláveis, seguras e com eficiência energética. Para dar suporte a esses modelos fundamentais e cargas de trabalho de IA, a IBM revelou um processador e acelerador para aprimorar a
Como Projetos de Inteligência Artificial Generativa que usam grandes modelos de linguagem (LLMs) transitam do estágio experimental ao uso diário, surgiu a necessidade urgente de tecnologias escaláveis, seguras e com eficiência energética. Para dar suporte a esses modelos fundamentais e cargas de trabalho de IA, a IBM revelou um processador e acelerador para aprimorar a
Registro Rápido

Obtenha um Bônus de 50% agora. Até 90% de lucro em 60 segundos. Conta demo gratuita!!

90%
Pontuação de Confiança