Em março de 2025, durante a conferência GTC (GPU Technology Conference), a Nvidia apresentou seus novos superchips de inteligência artificial: o Blackwell Ultra GB300 e o Vera Rubin. Esses lançamentos representam avanços significativos no desempenho computacional, visando atender à crescente demanda por processamento em aplicações de IA.
Blackwell Ultra GB300: Potência Imediata para IA
Previsto para o segundo semestre de 2025, o Blackwell Ultra GB300 mantém os 20 petaflops de desempenho em IA do modelo anterior, mas com melhorias notáveis:
- Memória aprimorada: 288 GB de HBM3e, um aumento em relação aos 192 GB do Blackwell original.
- DGX GB300 Superpod: Configuração com 288 CPUs e 576 GPUs, oferecendo 11,5 exaflops de computação FP4 e 300 TB de memória.
- Desempenho superior: Capacidade de processar 1.000 tokens por segundo, dez vezes mais rápido que os chips H100 de 2022.
Além disso, a Nvidia introduziu o DGX Station, um desktop equipado com o GB300, 784 GB de memória unificada e conectividade de 800 Gbps, tornando o poder de supercomputação mais acessível.
Além disso, a Nvidia introduziu o DGX Station, um desktop equipado com o GB300, 784 GB de memória unificada e conectividade de 800 Gbps, tornando o poder de supercomputação mais acessível.Vera Rubin: A Próxima Geração de Arquitetura de IA
Programado para o segundo semestre de 2026, o Vera Rubin representa um salto arquitetônico:
- Desempenho elevado: 50 petaflops de computação FP4 por chip, 2,5 vezes mais que o Blackwell.
- CPU Vera: Processador personalizado com 88 núcleos ARM e 176 threads, conectado via NVLink a 1,8 TB/s.
- Memória HBM4: Utiliza tecnologia HBM4, com modelos iniciais apresentando 8 pilhas e a variante Ultra incorporando 12 pilhas, aumentando a largura de banda e o desempenho.
A arquitetura Vera Rubin também introduz o CX9 SuperNIC e switches NVLink 6, capazes de transferências de dados de até 3.600 GB/s, garantindo execução de cálculos complexos com latência mínima.
Rubin Ultra: Superando Limites
Previsto para 2027, o Rubin Ultra combina dois GPUs Vera Rubin em um único pacote:
- Desempenho máximo: 100 petaflops de computação FP4 por chip.
- Memória expansiva: 1 TB de HBM4e por GPU, com um total de 365 TB em um rack NVL576.
- Capacidade de treinamento: 15 exaflops para inferência FP4 e 5 exaflops para treinamento FP8, representando uma melhoria de 14 vezes em relação ao Blackwell Ultra.
Essas especificações posicionam o Rubin Ultra como uma solução ideal para implantações em larga escala em instituições de pesquisa e entidades governamentais.
Feynman: O Futuro da Computação de IA
Durante a GTC 2025, o CEO da Nvidia, Jensen Huang, anunciou que a arquitetura subsequente será chamada Feynman, em homenagem ao físico teórico Richard Feynman. Prevista para 2028, essa arquitetura continuará a trajetória de melhorias exponenciais no desempenho, incorporando a CPU Vera e outras inovações.