A NVIDIA e a OpenAI lançaram os modelos de raciocínio aberto mais rápidos

robot
Geração de resumo em curso

A NVIDIA e a OpenAI acabaram de lançar dois novos modelos de raciocínio com pesos abertos, gpt-oss-120b e gpt-oss-20b. O modelo 120b pode processar 1,5 milhões de tokens por segundo em um único sistema NVIDIA GB200 NVL72. Isso é possível graças a uma combinação da arquitetura Blackwell da NVIDIA e um novo formato de precisão de 4 bits chamado NVFP4. Esse formato ajuda a equilibrar precisão e eficiência.

O que Potencia os Modelos

O que ajuda estes modelos a funcionar de forma tão eficiente é uma combinação de novo hardware e software inteligente. Eles foram treinados nos poderosos GPUs H100 da NVIDIA e foram projetados para funcionar suavemente numa ampla gama de dispositivos. Você pode usá-los desde grandes sistemas de nuvem até PCs desktop normais com placas NVIDIA RTX. Se você já usa CUDA, provavelmente pode executar estes modelos sem muito trabalho extra.

Ambos os modelos também são embalados como o que a NVIDIA chama de "Microserviços de Inferência." Isso torna os modelos comparativamente mais rápidos e fáceis. Você não precisa construir tudo do zero. E se você já está usando ferramentas de IA populares como Hugging Face ou Llama.cpp, esses modelos se integrarão facilmente.

O novo hardware Blackwell da NVIDIA desempenha um grande papel aqui também. Inclui uma funcionalidade chamada NVFP4, que ajuda os modelos a funcionar mais rapidamente e de forma mais eficiente, utilizando números de menor precisão sem perder precisão. Isso pode parecer técnico, mas o resultado é bastante simples. Resultará em IA mais rápida que utiliza menos energia e memória. Para as empresas, isso pode significar custos mais baixos.

Há também um relacionamento de longa data entre a NVIDIA e a OpenAI que ajudou a tornar isso possível. Este relacionamento remonta ao momento em que Jensen Huang entregou pessoalmente o primeiro DGX-1. O que está a acontecer agora com a série gpt-oss parece ser o próximo passo lógico nessa colaboração. No entanto, essas produções exigirão ordens de magnitude mais de poder computacional, polimento e prontidão operacional. O seu hardware, software e serviços estão todos a trabalhar em conjunto, o que é raro ver a este nível.

Aberto a Todos para Construir

Uma das coisas mais importantes sobre este lançamento é que os modelos são abertos. Isso significa que qualquer pessoa, desde startups até universidades, também pode trabalhar neles. Eles podem construir sobre eles, personalizá-los e usá-los em seus sistemas. A OpenAI agora tem mais de 4 milhões de desenvolvedores ativos construindo em sua plataforma. A NVIDIA, por sua vez, tem mais de 6,5 milhões de desenvolvedores usando suas ferramentas de software. Eles têm trabalhado juntos por quase uma década, e o alcance é enorme. Existem centenas de milhões de GPUs em todo o mundo que operam na plataforma NVIDIA CUDA. Quando uma tecnologia como esta é lançada em um ecossistema tão grande e experiente, a adoção tende a ocorrer rapidamente. E é aqui que isso começa a parecer menos um lançamento e mais um ponto de virada.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)